Industras

Smart Speaker: Voice Recognition of Everything

Share with

Article by: Asst. Prof. Suwan Juntiwasarakij, Ph.D., MEGA Tech Senior Editor

เทคโนโลยีรู้จำเสียงทำให้ผู้บริโภคสามารถทำงานได้หลายอย่างในเวลาเดียวกันนั้นเป็นผลผลิตจากเทคโนโลยี Machine Learning ผสมผสานกับเทคนิคการเขียนโปรแกรมขั้นสูง บริษัทในกลุ่มเทคโนโลยีต่างก็สนใจที่จะทำให้เทคโนโลยีรู้จำเสียงเป็นมาตรฐานสำหรับผลิตภัณฑ์เครื่องใช้ไฟฟ้าของตน บริษัทเหล่านื้มีจุดมุ่งหมายที่จะสร้างระบบผู้ช่วยสั่งงานด้วยเสียงที่มีความสามารถในการโต้ตอบอย่างถูกต้องและถูกบริบท มากไปกว่านั้นได้มีผลการศึกษาวิจัยที่ยืนยันว่าระบบผู้ช่วยเสมือนที่สั่งการด้วยเสียงได้รับการพัฒนาต่อยอดอย่างไม่หยุดยั้ง

Percentage of assistant applications through voice (past month)
Source: GlobalWebIndex

How Does It Work?

ระบบรู้จำการสนทนานั้นเป็นเทคโนโลยีที่สามารถเข้าใจคำพูดซึ่งจะแปลงให้เป็นตัวอักษรในลำดับต่อไป ส่วนระบบรู้จำเสียงนั้นเป็นเพียงส่วนหนึ่งของระบบรู้จำการสนทนาแต่เพียงเท่านั้น งานหลักของซอฟต์แวร์ระบบรู้จำเสียง คือ การวิเคราะห์เสียงที่เกิดจากมนุษย์ เริ่มจากระบบกลั่นกรองเสียงพูด แปลงเสียงให้อยู่ในรูปสัญญาณดิจิตัลที่สามารถอ่านได้ จากนั้นจึงวิเคราะห์เพื่อค้นหาความหมาย ด้วยขั้นตอนที่กล่าวมานี้เองที่ทำให้เกิดความแม่นยำสูงในการประกอบสร้างความหมายเพื่อพยายากรณเอย่างแม่นยำว่าเสียงที่พูดออกมานั้นหมายถึงอะไร

Baidu’s Speech Recognition Technology
Source: Baidu

บริษัทกลุ่มไฮเทคยักษ์ของโลก เช่น Facebook, Amazon, Microsoft, Google, Apple ได้นำเสนอและบรรจุเทคโนโลยีเทคโนโลยีรู้จำและสั่งงานด้วยเสียงดังกล่าวลงในอุปกรณ์ของตนเองอย่างเช่นผลิตภัณฑ์ Google Home, Amazon Echo, and Siri และบริษัทเหล่านี้ล้วนมีความพยายามที่จะทำให้ระบบรู้จำเสียงกลายเป็นองค์ประกอบที่ฝังอยู่ในสินค้าและผลิตภัณฑ์ของตน เป้าหมายหนึ่งที่บริษัทเหล่านี้มีร่วมกันคือการพัฒนาขัดเกลาทำให้ระบบช่วยเหลือรู้จำเสียงสามารถโต้ตอบกับมนุษย์ด้วยความถูกต้องแม่นยำสูงทั้งในเนื้อและบริบท

Smart speakers are the 7th most used device on daily basis.
Source: Deloitte Mobile Consumer Survey

Smart Speakers

ลำโพงไร้สายที่ผนวกเข้ากับระบบผู้ช่วยเสมือนที่สั่งด้วยเสียง มีขีดความสามารถหลากหลาย ไม่ว่าเป็นการค้นหาข้อมูล การเล่นดนตรี การซ็อปป้ำงออนไลน์ ไม่ว่าจะทำอะไรนั้นก็จะขึ้นอยู่กับคำสั่งเสียงที่มาจากผู้ใช้งาน นับตั้งแต่ลำโพง “Echo” ซึ่งเป็นผลงานของ Amazon ที่เปิดตัวไปในปี 2015 นับว่าเป็นผู้บุกเบิกในด้านนี้ ยังคงได้รับความนิยมจากผู้บริโภคเพิ่มมากขึ้นเรื่อยๆ อย่างไรก็ดี “Google Home” ซึ่งเป็นผลงานของ Google ก็ได้ลงมาแข่งขันด้วย ส่งผลทำให้ตลาดมีความคึกคักมากขึ้น ทำให้ยอดตัวเลขการส่งและจำหน่ายสูงขึ้นอย่างมหาศาลจาก 6.57 ล้านหน่วยในปี 2016 เป็น 92.25 ล้านหน่วยในปี 2019 โดยตลาดที่ใหญ่ที่สุดเป็นของประเทศสหรัฐอเมริกา และที่ขนาดรองลงมาคือประเทศจีน

Smart Speakers Quarterly Shipment Share by Vendor (2016-2019)
Source: Global smart speaker vendors’ market share 2016-2019, STATISTA

China: Where the Opportunities Grow

ตลาดลำโพงอัจฉริยะสั่งการด้วยเสียงมีโอกาสที่จะเติบโตไม่ว่าจะอยู่ในมุมใดของโลกก็ตาม โอกาสที่เกิดขึ้นดังกล่าวนี้เป็นผลมาจากการขยายตัวของตลาดไปสู่ประเทศที่ไม่ใช้ภาษาอังกฤษเป็นภาษาหลัก และในปลายปี 2017 พบว่ายอดขายลำโพงอัจฉริยะถูกจำกัดอยู่ในประเทศที่ใช้ภาษาอังกฤษเป็นภาษาหลัก โดยเป็นการขายที่เกิดขึ้นในประเทศสหรัฐอเมริกาและสหราชอาณาจักรถึง 95 เปอร์เซ็นต์ อย่างไรก็ตาม นับตั้งแต่ต้นปี 2019 ลำโพงอัจฉริยะและยอดการขายได้พุ่งทะยานมาจากตลาดในกลุ่มประเทศที่ใช้ภาษาจีน ภาษาฝรั่งเศษ ภาษาสเปน ภาษาอิตาเลี่ยน และภาษาญี่ปุ่นเป็นภาษาหลัก ด้วยมุมมองการตลาดเปรียบเทียบ เป็นที่ชัดเจนว่าการเติบของลูกเล่นการค้นหาด้วยเสียงเป็นปัจจัยสำคัญขับเคลื่อนตลาดที่สำคัญ โดยตลาดในประเทศอินเดีย ประเทศจีน และประเทศอินโดนีเซียมีขนาดใหญ่ในอันดับต้นของเอเชียตามลำดับ

Survey of using voice searching or commands on any device (past month)
Source: GlobalWebIndex
Smart speaker adoption by country
Source: Deloitte Global Mobile Consumer Survey

หลักเกณฑ์หนึ่งที่นำมาใช้เป็นตัววัดคุณค่าอรรถประโยชน์ก็คือความถี่ของการใช้งาน ในหกประเทศที่ปรากฎอยู่ในรูปด้านบนเป็นประเทศที่ใช้ลำโพงอัจฉริยะในชีวิตประจำอยู่เป็นประจำถึงแม้ว่าเป็นเพียงส่วนน้อยก็ตาม ประโยชน์ใช้สอยของลำโพงอัจฉริยะนั้นขึ้นอยู่กับว่าจะไปใช้ประยุกต์ใช้งานอย่างไร ส่วนใหญ่แล้วลำโพงอัจฉริยะสั่งการด้วยเสียงถูกใช้เพื่อเล่นเพลง ซึ่งก็ไม่ใช่แนวทางการใช้งานที่สร้างความแตกต่างหรือสั่นสะเทือนให้แก่ตลาดมากนัก และผลการสำรวจช่วงกลางปี 2018 ของ Deloitte ได้แสดงให้เห็นว่า 5 ใน 6 ประเทศ ใช้ลำโพงอัจฉริยะเพื่อการเล่นเพลงเป็นอันดับที่ 1 และใช้เพื่อตรวจสอบสภาพอากาศเป็นอันดับที่ 2 โดยมีแคนาดาเพียงประเทศเดียวที่อันดับ 1 และ 2 ตรงกันข้ามกับประเทศทั้งหมดในกลุ่ม

Top five applications of smart speakers in selected markets
Source: Deloitte Global Mobile Consumer Survey

Take-Home Message

เมื่อพิจารณาอย่างถี่ถ้วนแล้วจะเห็นว่ายังมีความท้าทายเทคโนโลยีรู้จำเสียงอยู่ แต่ก็ไม่สามารถละเลยผลกระทบและอรรถประโยชน์ที่จะเกิดขึ้นในระยะยาวได้ ไม่ว่าจะฝังตัวอยู่ในอุปกรณ์ใดก็ตามระบบรู้จำเสียงและระบบผู้ช่วยสั่งการด้วยเสียงเป็นเสมือนหน้าประตูที่เปิดให้ผู้บริโภคทุกคนสามารถเก็บเกี่ยวใช้ประโยชน์จากจักรกลคอมพิวเตอร์ได้อย่างเต็มที่ เป็นไปได้ว่าในอนาคตผู้คนจะหันมาพูดคุยกับลำโพงเป็นจำนวนมาก ซึ่งมากกว่าที่เป็นอยู่ในปัจจุบัน และ “เสียง” พร้อมกับเทคโนโลยีรู้จำจะเป็นส่วนปฏิสัมพันธ์กับอุปกรณ์ต่างๆ และจะกลายมาเป็นส่วนปฏิสัมพันธ์หลักให้แก่ผู้ที่มีความท้าทายทางด้านการมองเห็น หรือมีประเด็นในการใช้คีย์บอร์ดหรือปุ่มกดขนาดเล็ก และเป็นเทคโนโลยีที่มีประโยชน์มากกับสังคมผู้สูงอายุ

Smart Speaker: Voice Recognition of Everything

Share with

Article by: Asst. Prof. Suwan Juntiwasarakij, Ph.D., MEGA Tech Senior Editor

Voice recognition allows consumers to multitasking by using machine learning and sophisticated algorithm. Technology companies are interested in making voice recognition a standard for most products. One goal of these companies may be to make voice assistants speak and reply with greater accuracy around context and content. Moreover, research shows that use of virtual assistants with speech recognition capabilities expected to be unceasingly increasing.

Percentage of assistant applications through voice (past month)
Source: GlobalWebIndex

How Does It Work?

Speech recognition is technology that can recognize spoken words, which can then be converted to text. A subset of speech recognition is voice recognition, which is the technology for identifying a person based on their voice. Voice recognition software works by analyzing the voice humans make. It filters what is said, digitizes it into a format it can read, and then analyzes it for meaning. Based on algorithms and previous input, it can then make a highly accurate educated guess to what humans are saying.

Baidu’s Speech Recognition Technology
Source: Baidu

Facebook, Amazon, Microsoft, Google, and Apple are among the world top’s tech companies that are already offering the feature on various devices through services like Google Home, Amazon Echo (Alexa), and Siri. These companies are working toward making voice recognition a standard for most products. One popular goal of these companies is to make voice assistants speak and replay with greater accuracy around context and content.

Smart speakers are the 7th most used device on daily basis.
Source: Deloitte Mobile Consumer Survey

Smart Speakers

A wireless speaker with an integrated virtual voice assistant, a smart speaker performs tasks such as seeking information, play music, shopping online, etc., upon receiving voice commands from users. Since Amazon introduced its pioneering Echo speaker into consumer market in 2015, the smart speaker has gained increasing popularity among consumer. The market became more dynamic after Google entered the competition with its Google Home speaker and shipment figures went up dramatically from 6.57 million in 2016 to 92.25 million in 2019. The United States is the largest country market, followed by the Chinese market.

Smart Speakers Quarterly Shipment Share by Vendor (2016-2019)
Source: Global smart speaker vendors’ market share 2016-2019, STATISTA

China: Where the Opportunities Grow

Smart speakers have a world opportunity for growth. Much of that opportunity comes from expansion into non-English-speaking countries. At the end of 2017, smart speaker sales were largely confined to English-speaking markets, with more than 95 percent of sales in the United States and the United Kingdom. However, at the beginning of 2019 these speakers are spreading their linguistic wings, and sales take off in countries in which the majority of the population speaks Chinese, French, Spanish, Italian, or Japanese. From a market-by-market perspective, it is clear that voice search growth is being driven by the key Asian markets, with India, China, and Indonesia coming out on top.

Survey of using voice searching or commands on any device (past month)
Source: GlobalWebIndex
Smart speaker adoption by country
Source: Deloitte Global Mobile Consumer Survey

One measurement of utility is the frequency of usage. In six countries mentioned above, most smart speakers are use daily, but it is a slender majority. Indeed, based on a sample of countries with relatively mature smart speaker markets, these devices are only the seventh-most used device on daily basis. The smart speaker’s usefulness also partly depends on the range of applications for which it can be used. In most markets, they have most commonly been used to play music, which arguably is not that disruptive. Deloitte research from mid-2018 showed that smart speakers’ No.1 application across five countries was to play music, except in Canada where checking the weather was the top usage, in most other markets, weather was the No.2 applications.

Top five applications of smart speakers in selected markets
Source: Deloitte Global Mobile Consumer Survey

Take-Home Message

All thing considered, while voice recognition can be challenging, the long-term benefits are significant. Whether on a speaker or any other device, voice recognition and voice assistants open up the benefits of computing to everyone. It is probably that people over time will end up talking to speakers much more than they do today. Voice may never become the dominants user interface with technology, but it is very likely to become a core one, particularly for those who are vision-impaired and/or may struggle with keyboards or small buttons. The technology would be very much of help for an aging society. 

スマートスピーカー:すべての声を認識する

Share with

Article by: Asst. Prof. Suwan Juntiwasarakij, Ph.D., MEGA Tech Senior Editor

声認識によって消費者は機械学習や高度なアルゴリズムを使用したマルチタスクの実行が可能になります。テクノロジー企業はほとんどの製品に声認識を標準搭載することに関心を寄せています。それら企業の目標の一つは、音声アシスタントが文脈や内容に沿った正確な発言や返答ができるようにすることです。さらに、研究によると音声認識機能を持つバーチャルアシスタントの需要はますます拡大していきます。

Percentage of assistant applications through voice (past month)
Source: GlobalWebIndex

声認識とは?

音声認識とは話された単語を認識し、文字に変換する技術です。声認識は音声認識の一部で声によって人物を見分ける技術です。声認識ソフトは人が発する声を分析します。話された事を抽出し、読み取り可能な形式にデジタル化し、意味を分析します。アルゴリズムとそれまで入力された情報を基に人が何を言っているのか精度の高い予測ができます。

フェイスブック、アマゾン、マイクロソフト、グーグル、アップルなど世界の一流テクノロジー企業は、すでにGoogle Home、Amazon Echo(アレクサ)、Siriなどのサービスを様々なデバイスで提供しています。これら企業は声認識をほとんどの製品に標準搭載することを目指しています。その主な目標は声認識アシスタントが文脈や内容に沿った正確な発言や返答ができるようにすることです。

Smart speakers are the 7th most used device on daily basis.
Source: Deloitte Mobile Consumer Survey

スマートスピーカー

AIアシスタント機能を持つワイヤレススピーカー、スマートスピーカーは、ユーザーからの音声指示を受けて情報検索、音楽再生、オンラインショッピングなどの操作を実行できます。2015年にアマゾンがAmazon Echoを市場に送り出して以来、スマートスピーカーの人気は高まっています。グーグルがGoogle Homeを発売したことで市場はより活性化し、2016年の657万台から2019年の9,225万台へと出荷数が大幅に増加しました。アメリカは最大の市場で、中国がその後を追っています。

Smart Speakers Quarterly Shipment Share by Vendor (2016-2019)
Source: Global smart speaker vendors’ market share 2016-2019, STATISTA

中国:成長地域

ต スマートスピーカーは世界的に成長しています。特に英語圏以外の国での伸びが著しく見られています。2017年の終わり頃、スマートスピーカーは英語圏の市場に限定されており、95%はアメリカとイギリスで販売されていました。しかし2019年からスピーカーの言語多様化により、ほとんどの人が中国語、フランス語、スペイン語、イタリア語、日本語を話す国々での売り上げが伸びています。市場ごとに見ると、音声検索の増加はインド、中国、インドネシアなどアジアの主要市場が牽引しています。

Survey of using voice searching or commands on any device (past month)
Source: GlobalWebIndex
Smart speaker adoption by country
Source: Deloitte Global Mobile Consumer Survey

使用頻度は実用性を図る目安の一つです。上記6カ国ではほとんどのスマートスピーカーが毎日使用されていますが、その大半の使用回数は限られています。実際、スマートスピーカー市場が比較的成熟した国々の例では、日常使用するデバイスの中で使用頻度は7番目に位置しています。スマートスピーカーの実用性は使用できるアプリの種類にも左右されます。ほとんどの市場では音楽再生が最も一般的な使用ですが、それほど拡散しているわけではありません。2018年半ばからのデロイトの調査では5か国で最も使用されているスマートスピーカーアプリは音楽再生アプリでした。カナダだけはお天気アプリが最もよく使用されており、お天気アプリはほとんどの市場で第2位となっています。

Top five applications of smart speakers in selected markets
Source: Deloitte Global Mobile Consumer Survey

重要ポイント

これらを総合すると、声認識には問題点もありますが、長期的な視点で見れば有用です。スピーカーであれ他のデバイスであれ声認識や音声アシスタントはすべての人にとって利点があります。もう少しすれば、今以上にスピーカーと会話することが増えるでしょう。音声が主なインターフェイスになることはないでしょうが、視覚障害者や小さなキーボードやボタンの操作が困難なユーザーにとっては主な操作方法となり得ます。高齢化社会にとって有益な技術です。

May June 2019​

Creative Solutions by Professional Designers

+(48) 555-0120-88

hello@example.com

2972 Westheimer Rd. Santa
Ana, Illinois 85486

Main Offices
Monday-Friday: 8am-5pm
Saturday: 9am-Midday
© Industras 2024, All Rights Reserved.