外祖母一直是個倔強的小老太太,家里人怎么勸都堅決不放棄自己的粉紅翻蓋手機,可是隨著疫情不斷反復,沒有健康碼連菜市場都進不去的外祖母終于急了,終于換上了智能手機。
自從小輩們教會外祖母使用微信,顧及到老太太的老花眼,發語音就成了家族群的常態。
老太太一發就是一長串,有時候出門在外,難免會有不方便聽的時候。每每此時,大家就不禁感嘆微信的語音轉文字功能是多么便捷。
文字、語音都是為交流服務的,而科技的進步也讓交流變得更加快捷。在語音轉文字、文字合成語音等“黑科技”的背后,蘊含著哪些巧妙、實用、改變人們生活的技術呢?這些源自生活的研究,能否為中學科研帶來靈感呢?
社恐福音:語音轉文字
語音識別是一門非常復雜的學科,包含了聲學、信號處理、計算機科學、語言學、心理學等相關學科的知識,也是十年來發展最快的技術之一,并已經滲透到了人們的生活中,比如微信語音轉文字功能。
19年微信語音添加了語音轉文字功能后,解決了某些場合不方便聽語音的難題,并且經過幾年技術優化,一部分方言的識別也得以實現。
“再也不用擔心上學/上班時家里人發語音,又不方便戴耳機聽的情況啦!"
語音轉文字的出現,不僅滿足了不同場景下人們的社交需求,還可以應用到記錄工具,將聲音轉換為文字,便于工作學習等的記錄,提高效率。
從文字到語音的“逆發展”
外祖母老花眼,看手機信息還要帶上老花鏡,所以家里人都盡量給她發語音,但是總有不方便說話的時候,這就需要語音合成技術的幫忙了。
語音合成又稱文本語音轉換(Text to Speech,TTS)技術,顧名思義,是把文本信息轉化成語音信息。
在2011年9月20日iPhone4S的發布會上,蘋果高管與手機中Siri的對話被媒體稱是人工智能和人類的一次經典問答,語音助手也逐漸進入到大眾視野。
語音助手的出現,依托于5G技術與人工智能技術。人們與語音助手對話時,它們在數據庫搜索相關信息,再模擬人類的聲音表達出來,實現由字到音的轉化。
小到手機中的智能語音助手,大到物聯網智能家居,智能工廠等……可以預見在未來某些情境下,語音指令或將逐步代替文字指令。
語音合成技術被大眾所知是因為語音助手,“機器朗讀”有聲書的出現,才讓這項技術真正廣泛地應用到實際生活中。
語音合成技術將文字轉換合成為可理解的自然語音,這在人機交互過程中具有著極為重要的意義。
不只是“機器朗讀”有聲書,我們在看視頻時,經常會聽到一些機器合成的配音,用聲調平淡、發音機械的聲音讀出詼諧風趣的句子,其反差經常讓人捧腹大笑。
國內不少學者在研究中指出,“【聲音】在未來傳播中將回歸主流介質”。語音合成技術的不斷進步影響著交流速度、交互性、可及性的改變,從而創造了新的社交語境和文化,改變人們的日常生活。
翰林有方W老師也曾在講座中分享過:中學生選題做科研時,要學會立足于實際生活,注重觀察,在日常生活中學會發現問題,解決問題。
無論是語音轉文字,還是用文字合成語音,都是生活中常見的技術應用,它們同樣可以作為研究主體,并且解決實際問題。如果你也對語音合成有興趣,不妨了解下這個課題。
課題介紹
課題名稱: 基于神經網絡的語音合成
相關學科:計算機科學技術
課題介紹:本研究課題預期通過深度網絡模型進行語音合成,將文本通過網絡學習生成對應的發音。通過本項目的研究會提出一種語音合成方法,能夠提升合成語音的自然度以及對應MOS打分。最終實驗會在公開數據集LJ speech上進行語音合成。
導師介紹
復旦大學計算機博士,國內某高科技公司高級算法研究員;
研究領域:文本語音合成(TTS),音樂人工智能,音樂信息檢索,語音檢測,歌手識別等;
發表多篇SCI和國際頂會論文,曾申請多項國家級專利;
有多年中學生、本科生教學經驗。
聯系我們,開始你的科研之路
掃碼添加翰林顧問老師,咨詢了解

翰林有方本周新課題推薦








? 2025. All Rights Reserved. 滬ICP備2023009024號-1