現在連想網路創業都不容易,光會寫程式不懂行銷,有好的產品也是沒用,
花了許多心血開發出直接在線上透過語音轉文字技術自動快速製作影片字幕的網站,
明明對岸同樣性質的字幕處理網站,人家的客戶是央視、北京電視台之類的,
我卻連找人免費見證都沒人理,到底問題出在哪呢?是文案還是網站的問題呢?
真心請教創業版上的各位先進,煩請指點。
底下是我目前在YouTube上發的文案,就是到人家的影片中留言
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
強力募集100位 YouTuber 免費見證十倍速高效的 AI智慧字幕製作
您是常需製作影片字幕的 YouTuber 或影視媒體工作者嗎?
速可打邀請您來親自體驗,免費幫您製作10分鐘的影片字幕
詳見 https://eztype.cc/
kopoche wrote:
網易見外不是免錢的...(恕刪)
您這問題剛好解開了我一直想不通的疑惑,為何免費找人試用的效果這麼差。原來網友們都是行家,網上搜尋一下就會發現其實目前已有好幾家對岸做AI語音辨識字幕的網站,其中網易見外如您所說的是免費的,提供的服務也很多元。說真的,就AI中文語音相關領域的應用,目前台灣真的是比不過對岸的發展,其中最強的我認為應該就是訊飛,它完全可以電爆google、微軟、IBM的語音辨識。
那...如您所說,我們又有甚麼贏過人家的地方呢?這也是我開發網站期間時常問自己的一點,所以當然我也有去參考過目前對岸幾家業者處理字幕的方式,個人將其歸類出兩種模式:
1.上傳音檔,以各家的語音辨識技術產生出固定的辨識文字及句子的時間戳記,再以人工透過編輯器修改文字及調整字幕時間軸。
優點-直接使用辨識結果,所以不需提供逐字稿。
缺點-辨識的結果常常缺一堆字、出現音同字不同的情況,句子想重新斷行還得要自行修改時間軸,非常費時費工。
目前對岸如訊飛、百度、阿里、騰訊、網易、錄音啦...多數是使用此種模式,適合少量製作的使用者。
2.上傳音檔及逐字稿,先以語音辨識技術取得辨識結果,再輔以正確排版的逐字稿做二次校對,可依逐字稿的排版精準的產出字幕。
優點-字幕排版精準,不會有錯字,不用調整字幕時間軸。只要修改逐字稿就可重新產生字幕,方便快速。
缺點-需要提供正確排版的逐字稿。
納象雲字幕是使用此種模式,央視、北京電視台都是它的客戶,適合大量製作的使用者。
兩者共同的是都會先經過辨識引擎做語音辨識,而後者會再利用文字演算法自動匹配聲音與之對應的逐字稿做二次處理。其核心技術是在第二道的文字演算法,能有效提高字幕的精準度。
我們選擇的主要方式就是後者,個人覺得這種才有辦法簡單、快速、精準的處理字幕。當然我們也兼容前者,提供語音辨識結果讓沒有逐字稿的使用者也能較快產出字幕。所以兩種方式可兼容並行,算是我們與其他家最大的不同之處吧。
說真的不是所有影音檔都適合使用AI語音辨識來製作字幕,目前還是有極大的限制,不論用哪一家的辨識引擎都一樣,沒辦法像人一樣能自動過濾掉背景很複雜的聲音,不信可以拿個音樂MV或戶外收音不佳的影片試試,保證辨識結果肯定都一樣慘不忍睹。所以音質清晰、發音正常的較適合使用AI語音辨識,應用的情境如教學影片、開箱、介紹、廣告、電台訪談...。
看一下我們字幕製作的實際操作的影片(約2:50之後),您可以更容易理解我說的差異
https://www.youtube.com/watch?time_continue=168&v=CCKSjbfwCk8



























































































