女人叫床最下贱的短语|www.pppp|国产无码电影|游泳教练在水里含我奶在线观看|日韩欧美一区二区三区中文精品|欧美日韩免费观看一区二区三区黄片|日韩新片av网|《朋友的妻子》hd|亚洲字幕久久|日韩手机在线观看,校园 春色 激情 人妻,久久国产V一级毛多内射,国产精品久久久久久久久久懂色 ,92精品国产成人观看免费,91福利免费视频,看片视频

和Siri說“儂好”,它聽得懂嗎?

日期:06-04-2024

圖片

  作為一名合格且優(yōu)秀的智能助理,Siri肯定不是只會講笑話的“人工智障”。

  只需要動動嘴,Siri就能打電話、發(fā)短信、定鬧鐘、放音樂,也可以幫你這個“金魚腦子”記記瑣事——比如“我車又停哪里了?”。

圖片

圖源:Apple官網(wǎng)

  能干的Siri,能干的遠不止這些。在語音識別技術(shù)進入車載導航、家居電氣、客服服務等領(lǐng)域后,智能生態(tài)系統(tǒng)不斷完善,調(diào)節(jié)燈光亮度、找個加油站,它也能輕松拿捏。

  雖然Siri在2007年才成立,但“人類通過語音命令操作機器”這個想法早在20世紀60年代便出現(xiàn)了,并在1962年西雅圖世博會上成功現(xiàn)世后引起了人們極大的興趣。

  世博創(chuàng)新A-Z:語音識別

  A to Z of Innovations at Expos

  1961年:語音識別技術(shù)誕生

  1957年10月4日,蘇聯(lián)發(fā)射了第一顆人造地球衛(wèi)星,美國隨后急起直追,“太空競賽”由此拉開序幕。以“太空時代的人類”為主題的1962年西雅圖世博會是一個科學博覽會,以“讓科學占據(jù)顯著的地位,為人類進步和幸福而努力”為方針,將未來與空間緊密聯(lián)系在一起。

圖片

1962年西雅圖世博會展館內(nèi)景

  格雷厄姆公司設(shè)計的標志性建筑“太空針”就充分體現(xiàn)了時代精神。拔地而起的3支鋼架凌空會合又彼此張開,輕輕托舉著一只碩大的“飛碟”,充滿了神奇浪漫的科幻氣息。“太空針”高184米,“飛碟”直徑42米,成為密西西比河西部首屈一指的地標。

圖片

1962年西雅圖世博會

“太空針”

圖片

  加州理工大學和華盛頓大學建筑系教授參與了工程設(shè)計,“太空針”足以承受每小時320公里的颶風和9級地震,這種超常的穩(wěn)定性和安全性來自10米深、6000噸重的鋼筋水泥基礎(chǔ)。當?shù)叵虏糠值馁|(zhì)量幾乎和地上部分相等,“太空針”的重心僅僅高于地面1.5米。

圖片

世博會博物館第3展廳“樂觀信念”展出的

太空針模型

  作為IBM于1961年設(shè)計的實驗性設(shè)備,Shoebox是掌握語音識別的早期嘗試。它的開發(fā)者William C. Dersch在該博覽會上首次展示。

圖片

Shoebox(圖源:IBM官網(wǎng))

  機器將識別對著麥克風說的16個單詞,并將這些聲音轉(zhuǎn)換成電脈沖。與現(xiàn)代語音識別系統(tǒng)一樣,用戶可以看到他們說的話,確保沒有“誤解”。

圖片

1962年西雅圖世博會科技館

  該技術(shù)在世博會上的展出讓語音識別技術(shù)的發(fā)展得以加速,對后來Siri、Alexa和Watson AI也造成一定影響,但直到進入21世紀,語音識別技術(shù)才變得普遍。

  圖片

  Watson AI

  現(xiàn)在,語音識別遠不局限于簡單的數(shù)學運算,而是在我們的手機、電腦、手表、汽車上,以及在我們的家中,幫助人們執(zhí)行或完成大量的任務,并對查詢做出回應。

  實時同聲翻譯的實現(xiàn)

  語音識別技術(shù)可以在語言翻譯系統(tǒng)中實現(xiàn)輸入、輸出、分類等功能:將語音信號捕捉并轉(zhuǎn)換為文本,從而實現(xiàn)語言翻譯系統(tǒng)的輸入;幫助語言翻譯系統(tǒng)識別輸入語言的類型,從而選擇合適的翻譯模型;將翻譯后的文本轉(zhuǎn)換為語音信號,從而實現(xiàn)語言翻譯系統(tǒng)的輸出。

圖片

  在語言翻譯系統(tǒng)中,語音識別技術(shù)可以實現(xiàn)實時、高效、方便的語言翻譯,因而被廣泛應用于會議翻譯、遠程會議、語音郵件等場景。

  華為AI字幕

  華為 AI 字幕可以將手機內(nèi)的視頻或他人說的話實時轉(zhuǎn)為文字,并以字幕的形式呈現(xiàn)在屏幕上,使看視頻更方便;也可以幫助聽力不佳人士,打電話時可以將接收的語音轉(zhuǎn)為文字,還可以將輸入的文字轉(zhuǎn)為語音發(fā)送給對方;當與他人進行面對面交流時,將對方說的話轉(zhuǎn)換成文字字幕,并可以將輸入的文字實時轉(zhuǎn)換成語音播放給對方聽。

圖片

百度AI同傳助手

  提供高質(zhì)量、低延遲的機器同傳服務解決方案——百度 AI 同傳助手,支持同傳雙語字幕投屏,手機掃碼會議二維碼即可收聽同傳語音,視聽一體的沉浸式同傳體驗;支持中、英、日、韓等多語種同傳;會議后自動生成雙語會議紀要,不漏掉任何會議細節(jié),助力會議內(nèi)容快速整理。

圖片

  支持方言的“轉(zhuǎn)文字”

  在開發(fā)Shoebox的過程中,有人觀察到不同的單詞會使用更高或更低的音調(diào),從而實現(xiàn)了通過音頻過濾器來調(diào)節(jié)音調(diào),以便正確區(qū)分每個單詞。但發(fā)展早期(1950年代至1970年代)的語音識別技術(shù)主要基于手工設(shè)計的特征提取和模式識別方法,如傅里葉變換、波形比較等。這些方法的準確率相對較低,且對不同語言和口音的適應性較差。

圖片

Shoebox(圖源:IBM官網(wǎng))

  信息時代下,語音信息的交流越來越多,“轉(zhuǎn)文字”功能的運用也深入人心。但發(fā)語音的人有時更偏好方言,“轉(zhuǎn)文字”卻聽不明白,輸出的結(jié)果也五花八門,等到能聽語音時,溝通效率難免大打折扣。

  圖片

  中國電信人工智能研究院(TeleAI)于近日發(fā)布了業(yè)內(nèi)首個支持30種方言自由混說的語音識別大模型——星辰超多方言語音識別大模型,打破單一模型只能識別特定單一方言的困境。

  和Siri說“儂好”,它還真可能聽得懂。

  1962年西雅圖世博會上首次展現(xiàn)的語音識別設(shè)備僅能識別特定音節(jié),在人工智能技術(shù)和深度學習技術(shù)的快速發(fā)展下,語音識別技術(shù)得以突破,能夠處理連續(xù)的語音流,并準確反饋。現(xiàn)在,語音識別技術(shù)不僅能夠應用于會議記錄、翻譯交流、AI字幕、智能家居等場景,還能夠在方言環(huán)境下實現(xiàn)信息傳遞功能。未來,該技術(shù)將會更加智能化、個性化。

  編輯:趙翊苓