- Endchan Magrathea

金蚵拉
12/10/2024 19:17:00 No. 5168 [Open] [Reply]
thumbnail of __aventurine_honkai_and_1_more_drawn_by_megu_pixiv9460065__sample-cfeb471c8572fdef7e4a776651023682.jpg
__aventuri... jpg
(103.59 KB, 850x1338)
今天跟師父聊到，他其實正在研究作AI助理，
我問他是文字陪聊然後有皮的那種嗎？
他是說能夠語音溝通的那種，
我就想這個原理大概是，這會需要人聲模型跟文字生成模型，
[語音輸入-AI語音轉文字]-AI文字轉指令-AI接收指令-文字模型AI產生文本-人聲AI產生人聲-回應
然後我之前有看過一個AI作V皮的方法，
正確來說V皮的面部掃描就是AI運算基礎，
只要有一套穩定(造型不會因為演算變化)的V皮，
在配合剛才所說的流程就能夠完成所謂的AI助理。
但這取決於效能，你語音輸入指令後，
結果電腦效能不夠運算大半天才給你回應這實在也是很出戲。

那師傅這個想法讓我有個大膽的想法是，
那我可不可以作一個V皮，然後語音輸入的部分改成掃描YT直播聊天室，
達成一個自動與觀眾對談的V，然後24小時馬拉松運作的萌娘AI，
供觀眾或是粉絲盡情互動。
不知道你們覺得這玩意有沒有潛力？