網際網路+是人工智慧的基石,人工智慧是大資料催生的產物,現在AI的基礎演算法,都是十年前的東西了,為什麼現在突然發揚光大了,神奇無比了,因為有大量的資料,可以進行推演論證。
語音識別就是一個最好的例子,不說實驗室裡的時光,單是從Windows作業系統開始有語音識別,到現在也不止十年了,可為什麼這兩年才真正開始普及,兩個原因,一個是識別率的提升讓其真正有了實用性,二個是使用成本低至幾乎可以忽略的程度。
先說識別率,我記得有過一個材料,說最初科大訊飛做語音識別的時候,就人民大學還是哪裡有一個百萬字級別的語音庫(拿不太準了,有準確資料的朋友回覆一下),幾乎是中文語音識別行業共用的唯一原材料。在這個基礎上,科研工作者就是聰明出個花來,也是巧婦對為無米之炊。而現在,估計隨便哪個做語音研究的實驗室裡,都是億級的資料庫了吧。這些資料哪裡來的,網際網路各類的APP是最好的資料來源。API方式的應用降低開發成本,讓APP的使用者體驗更好,資料庫又反哺後端演算法,這就形成一個良性迴圈。
網際網路+利用新商業、新格局、新思維的方式,將原來各行行業的“資訊化”孤島開放,連通,引發大家都在追逐“平臺化”。而平臺化的過程,大家都開始意識到資料的價值,又有意無意的產生了更多的資料(主要是非結構化資料),而推進資料價值挖掘、使用者提驗提升的過程中,人工智慧才又重新站上歷史舞臺。
網際網路+是人工智慧的基石,人工智慧是大資料催生的產物,現在AI的基礎演算法,都是十年前的東西了,為什麼現在突然發揚光大了,神奇無比了,因為有大量的資料,可以進行推演論證。
語音識別就是一個最好的例子,不說實驗室裡的時光,單是從Windows作業系統開始有語音識別,到現在也不止十年了,可為什麼這兩年才真正開始普及,兩個原因,一個是識別率的提升讓其真正有了實用性,二個是使用成本低至幾乎可以忽略的程度。
先說識別率,我記得有過一個材料,說最初科大訊飛做語音識別的時候,就人民大學還是哪裡有一個百萬字級別的語音庫(拿不太準了,有準確資料的朋友回覆一下),幾乎是中文語音識別行業共用的唯一原材料。在這個基礎上,科研工作者就是聰明出個花來,也是巧婦對為無米之炊。而現在,估計隨便哪個做語音研究的實驗室裡,都是億級的資料庫了吧。這些資料哪裡來的,網際網路各類的APP是最好的資料來源。API方式的應用降低開發成本,讓APP的使用者體驗更好,資料庫又反哺後端演算法,這就形成一個良性迴圈。
網際網路+利用新商業、新格局、新思維的方式,將原來各行行業的“資訊化”孤島開放,連通,引發大家都在追逐“平臺化”。而平臺化的過程,大家都開始意識到資料的價值,又有意無意的產生了更多的資料(主要是非結構化資料),而推進資料價值挖掘、使用者提驗提升的過程中,人工智慧才又重新站上歷史舞臺。