__aventuri... jpg
(103.59 KB, 850x1338)
今天跟師父聊到,他其實正在研究作AI助理,
我問他是文字陪聊然後有皮的那種嗎?
他是說能夠語音溝通的那種,
我就想這個原理大概是,這會需要人聲模型跟文字生成模型,
[語音輸入-AI語音轉文字]-AI文字轉指令-AI接收指令-文字模型AI產生文本-人聲AI產生人聲-回應
然後我之前有看過一個AI作V皮的方法,
正確來說V皮的面部掃描就是AI運算基礎,
只要有一套穩定(造型不會因為演算變化)的V皮,
在配合剛才所說的流程就能夠完成所謂的AI助理。
但這取決於效能,你語音輸入指令後,
結果電腦效能不夠運算大半天才給你回應這實在也是很出戲。
那師傅這個想法讓我有個大膽的想法是,
那我可不可以作一個V皮,然後語音輸入的部分改成掃描YT直播聊天室,
達成一個自動與觀眾對談的V,然後24小時馬拉松運作的萌娘AI,
供觀眾或是粉絲盡情互動。
不知道你們覺得這玩意有沒有潛力?