久久成人国产精品麻豆,国产午夜精品久久久久免费视,国内精品久久久不卡影院,91插插插永久免费,国产三级一区二区三区在线,精品人妻一91区二区三区久久嗨,99久久99这里只有免费费精品 ,一本一道久久综合狠狠老,777久久久精品一区二区

設(shè)為首頁 - 加入收藏   
您的當(dāng)前位置:首頁 > 休閑 > AI語音輸入法 正在偷偷擠走鍵盤 正文

AI語音輸入法 正在偷偷擠走鍵盤

來源:企業(yè)錄(www.155tp.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 編輯:休閑 時(shí)間:2025-12-26 14:05:32

如果幾年前有人跟我說,語音「你以后寫稿可能不怎么需要鍵盤了」,輸入我大概會(huì)把這句話當(dāng)成一句玩笑。法正那時(shí)候我正處在對(duì)機(jī)械鍵盤的偷偷迷戀期,研究軸體、擠走鍵盤鍵帽、語音鍵程,輸入購入過 Cherry、法正Filco、偷偷NiZ、擠走鍵盤Keychron、語音3D 打印分體式鍵盤。輸入 甚至為了提高打字效率,法正專門學(xué)習(xí)過雙拼輸入法 。偷偷

我的擠走鍵盤注意力都放在消費(fèi)的快感上,很少認(rèn)真想過這樣一個(gè)問題:

敲鍵盤,真的是輸入的最優(yōu)解嗎?

真正的轉(zhuǎn)折,其實(shí)發(fā)生在我開始高頻使用各種 AI App 的這兩年。

第一次真正覺得「語音輸入這件事好像值得重視」,是各個(gè) AI App 里那個(gè)「語音轉(zhuǎn)文字」按鈕變得越來越好用的時(shí)候。這些 App 里的語音轉(zhuǎn)寫,明顯比傳統(tǒng)輸入法里的語音要聰明得多:它不僅能聽清我在說什么,還能自動(dòng)加上標(biāo)點(diǎn),幫我把一些口語化的表達(dá)整理得比較書面,甚至在我說得磕磕絆絆的時(shí)候,最后呈現(xiàn)出來的那一段文字讀起來仍然是順的。

主流的 AI 幾乎都覆蓋了語音轉(zhuǎn)文字功能|圖片來源:極客公園

更關(guān)鍵的是,它和后面的 AI 是連在一起的——我說完一句話,看到的不只是干巴巴的轉(zhuǎn)寫結(jié)果,而是 AI 根據(jù)這段話給我的反饋和回答。那一刻我第一次有了一個(gè)直觀的感受: 語音不再只是一個(gè)「替代鍵盤的輸入方式」,而是直接接在 AI 交互前面的那一層 。

第二個(gè)真正改變我看法的,是我在和 AI 打交道的過程中,越來越清楚地意識(shí)到:語音比打字流暢得多。

和真人聊天不同,和 AI 交互時(shí),我可以不管錯(cuò)別字、不管格式;也不需要一上來就組織成一段「體面」的文字;甚至可以中途換一個(gè)角度,AI 依然能跟得上。

持續(xù)一段時(shí)間之后,我發(fā)現(xiàn)一個(gè)很直觀的變化:在越來越多的場(chǎng)景里,我不再想「敲一段字問它」,而是更想「按住麥克風(fēng)直接說」。

01 Typeless 初體驗(yàn):🆘,它真的聽得懂我在說什么

我開始嘗試一些語音輸入法。

Wispr 算是其中名氣最大的一個(gè),但真正用下來,其實(shí)很難令人滿意。它的轉(zhuǎn)錄速度略顯拖沓,會(huì)有一個(gè)較為尷尬的等待時(shí)間;中文識(shí)別的準(zhǔn)確率也算不上理想,尤其是遇到一些專有名詞或者中英文混排的場(chǎng)景,經(jīng)常需要手動(dòng)修補(bǔ)。

閃電說(原名:代體)走的是本地小模型路線,它幾乎把「速度」做到了極致,轉(zhuǎn)寫過程幾乎是「你剛說完,字就出來了」,而且完全免費(fèi)。這種即時(shí)反饋在一開始確實(shí)給人非常強(qiáng)烈的爽感,第一次有了「手跟上腦子」的感覺。

但是也因?yàn)楸镜匦∧P偷脑?,它在?zhǔn)確率上就差強(qiáng)人意了。比如中英文混排、技術(shù)名詞夾雜口語、或者我說話節(jié)奏稍微快一點(diǎn)的時(shí)候,錯(cuò)誤率會(huì)明顯上升。

我還嘗試過一些其他的語音輸入法,包括豆包輸入法(iOS 端)、微信輸入法、Whisper Keyboard,甚至是蘋果聽寫(因?yàn)楦?,但它們或多或少都因?yàn)橐恍﹩栴}而無法讓人完全滿意。

最后, 我就注意到了 Typeless,并且最終常駐在了我的電腦中 。

我之前曾經(jīng)簡(jiǎn)單測(cè)試過各個(gè)語音輸入法,并做了一張四象限圖。Typeless 處于第二象限:速度中上,但文字的質(zhì)量最高。|圖片來源:極客公園

如果和之前試過的那些工具相比,Typeless 帶來的改變并不在于「速度快了一兩秒」,而是在于 它大幅降低了出錯(cuò)和返工的成本 。

很多語音輸入法的問題根本不在于轉(zhuǎn)錄的速度,而是它無法正確識(shí)別說話人的意圖,只要一兩個(gè)詞識(shí)別錯(cuò)了,你就不得不打斷思路,回到文字里一點(diǎn)一點(diǎn)修改,整段體驗(yàn)非常脆弱。

Typeless 給我的感覺剛好相反:它似乎真的理解「你想說什么」,而不是「你每個(gè)字到底是怎么說的」。哪怕我中途改口、補(bǔ)充、打斷自己,它也會(huì)盡量在結(jié)果里幫我拼出一個(gè)完整的、讀起來順暢的版本。

最直觀的改變是:我不需要再刻意湊近話筒了。為了更順暢地和 AI 交互,我之前特地買了一個(gè)麥克風(fēng)放在顯示器左側(cè)。因?yàn)檩斎敕ń?jīng)常識(shí)別不準(zhǔn),我總懷疑是不是距離太遠(yuǎn),于是下意識(shí)地把頭歪向麥克風(fēng)。

但現(xiàn)在,這種習(xí)慣已經(jīng)自然消失了。

為了不遮擋屏幕,麥克風(fēng)位于屏幕左側(cè),因此距離會(huì)稍遠(yuǎn)一些。

這些「理解意圖」的能力,在具體功能上體現(xiàn)得很直觀。比如說,我隨口一句「My shopping list, bananas, oat milk, dark chocolate」,在 Typeless 里看到的,不是一串用逗號(hào)隔開的原話,而是自動(dòng)幫我排好的一份購物清單:前面有標(biāo)題,下面是 1、2、3 的編號(hào)列表。

Typeless 可以把語音轉(zhuǎn)換成帶格式的文字|圖片來源:極客公園

又比如,我在 Gmail 里選中一段略顯隨意的英文郵件,只需要對(duì)著 Typeless 說一句「Turn it into a professional email」,它會(huì)在原地把那段話改寫成一封語氣、結(jié)構(gòu)都更正式的郵件正文。

Typeless 可以把文字重寫成郵件格式

再比如,我復(fù)制了一段日文介紹到屏幕下半部分,對(duì)著 Typeless 說「翻譯成中文」,它會(huì)在幾秒鐘之內(nèi)給出一段順滑自然的譯文——不是逐字直譯,而是能讀得進(jìn)去的那種中文。

Typeless 可以翻譯選中的文字

更有意思的一點(diǎn),是它會(huì)根據(jù)你當(dāng)前使用的 App 自動(dòng)調(diào)整語氣。如果我在聊天軟件里,對(duì)它說話可以非常隨意,出來的結(jié)果也會(huì)刻意保留這種口語感;但在工作場(chǎng)景 App 里,Typeless 給出來的文字就會(huì)明顯正式很多,標(biāo)點(diǎn)更規(guī)整。

根據(jù)不同 App 的上下文語境,Typeless 會(huì)調(diào)整說話的語氣

如果站在技術(shù)路線的角度看,這個(gè)轉(zhuǎn)變背后其實(shí)是從傳統(tǒng) ASR 到大語言模型的變化。過去的語音輸入,核心任務(wù)是識(shí)別——把聲音轉(zhuǎn)成文字,最好一個(gè)字不差。

而現(xiàn)在,大模型可以在同一個(gè)流程里同時(shí)做識(shí)別和理解: 它不只在「聽你說什么」,更在「猜你想表達(dá)什么」 。實(shí)際的直觀感受就是:以前我說話的時(shí)候要照顧機(jī)器,現(xiàn)在更多是機(jī)器在試圖適應(yīng)我的表達(dá)習(xí)慣。我會(huì)明顯感覺到,Typeless 并不是簡(jiǎn)單地把我的每一句話「抄」下來,而是連著前后的上下文,一起去判斷這段話應(yīng)該長成什么樣。

正因?yàn)橛羞@一層模型能力和「語氣感知」的變化,Typeless 在我的日常工作流程里,很快就從「可以試一試的新玩具」,變成了一個(gè)真正可以排在鍵盤旁邊的位置。

以前我總覺得自己是在「用語音替代打字」,現(xiàn)在回過頭來看,這種替代關(guān)系反而調(diào)轉(zhuǎn)過來了: 鍵盤更像是一個(gè)用來收尾和微調(diào)的工具,而大段的內(nèi)容輸入,已經(jīng)可以放心交給語音和 Typeless 。

02 幾乎沒有「缺點(diǎn)」,但有三點(diǎn)擔(dān)憂

如果單純從「工具好不好用」這個(gè)角度來評(píng)價(jià),Typeless 在我這兒其實(shí)很難挑出什么硬傷。識(shí)別足夠穩(wěn),意圖理解在絕大多數(shù)場(chǎng)景下靠譜,桌面端集成順滑,免費(fèi)額度對(duì)個(gè)人用戶來說也夠用(每周 4000 詞)。

在使用 Typeless 的 20 天中,我總共輸入了接近 8000 詞,平均每天 200 詞

真正令人擔(dān)心的地方,反而不在產(chǎn)品本身,而在它所處的環(huán)境。

第一個(gè)擔(dān)憂是大公司的入場(chǎng)。當(dāng)你把 Typeless 當(dāng)成日常工作的核心輸入層時(shí),很難不去想象另外一種可能性:如果哪一天,操作系統(tǒng)自己提供了一套同樣水準(zhǔn)、甚至更強(qiáng)的語音輸入能力,而且是系統(tǒng)級(jí)的、無處不在的,那我還有多少理由堅(jiān)持使用一個(gè)第三方工具?

從歷史上看,很多優(yōu)秀的第三方工具,最終都被系統(tǒng)抄到一個(gè)「八十分好用」的程度,然后慢慢失去了存在感。語音輸入這件事,也很有可能走到同樣的節(jié)點(diǎn)。 例如字節(jié)跳動(dòng)就推出了體驗(yàn)非常優(yōu)秀的豆包輸入法,加之最近討論很熱烈的豆包手機(jī),這種情況是很有可能在不久的將來發(fā)生 

第二個(gè)擔(dān)憂是免費(fèi)本地模型陣營的持續(xù)擠壓。閃電說這樣的工具,哪怕今天體驗(yàn)不算完美,但它不斷提醒用戶一件事:語音識(shí)別其實(shí)可以在本地設(shè)備上完成,而且零成本。隨著硬件繼續(xù)演進(jìn)、本地模型持續(xù)變強(qiáng),這一陣營的體驗(yàn)只會(huì)越來越好, 用戶對(duì)「語音轉(zhuǎn)文字這件事本身應(yīng)該是免費(fèi)的」這種預(yù)期,很難完全逆轉(zhuǎn) 。

Typeless 目前用更高的免費(fèi)額度和更好的整體體驗(yàn),在一定程度上對(duì)沖了這種心理落差,但長遠(yuǎn)來看,它仍然要回答一個(gè)問題:在一個(gè)「到處都是不錯(cuò)的免費(fèi)方案」的世界里,它能一直給用戶什么額外的價(jià)值,讓那 12 美元每個(gè)月看起來是值得的。

Typeless的付費(fèi)套餐為每月12美元,提供無限次的轉(zhuǎn)錄|圖片來源:Typeless 官網(wǎng)

第三個(gè)不算「擔(dān)憂」,更像是現(xiàn)實(shí)的約束,就是 iOS 端的體驗(yàn)。因?yàn)?iOS 的系統(tǒng)限制,使用 Typeless 必須跳轉(zhuǎn) App,這在使用體驗(yàn)上是非常致命的打擊。Typeless 想出的應(yīng)對(duì)方案是讓麥克風(fēng)在后臺(tái)常駐,但這同時(shí)又會(huì)帶來隱私和功耗的問題。

這些問題不是 Typeless 一家可以獨(dú)自解決的,它需要的是操作系統(tǒng)本身的配合。而這又回到了第一個(gè)問題:一旦像蘋果這種系統(tǒng)級(jí)別的廠商跟進(jìn),打擊將是致命的。

03 鍵盤,會(huì)被取代到什么程度

回頭看這幾年自己折騰輸入工具的歷程,我越來越強(qiáng)烈地意識(shí)到一個(gè)事實(shí):我們過去為鍵盤付出的那些努力,很大一部分是在幫一套并不那么「順手」的設(shè)計(jì)擦屁股。

QWERTY 布局本身并不是為了人體工學(xué)而生,它誕生于機(jī)械打字機(jī)時(shí)代,核心目的是降低卡紙、讓金屬字桿別那么容易打結(jié)。為了照顧機(jī)器,我們刻意犧牲了一部分人的效率,然后再用盲打訓(xùn)練、打字課和大量練習(xí),把這種妥協(xié)牢牢刻進(jìn)自己的肌肉記憶里。

最開始的打字機(jī)并不是 QWERTY 布局。1873 年,美國人 Christopher Sholes,將常用的字母組合分開排列,降低打字速度,以解決因按鍵復(fù)位機(jī)制緩慢而導(dǎo)致的打字卡頓問題,最終形成了 QWERTY 布局|圖片來源:Wikipedia

機(jī)械鍵盤、分體式鍵盤、各種人體工學(xué)鍵盤,本質(zhì)上都還停留在這種框架之內(nèi):我們?cè)诩榷ǖ母褡永?,想辦法讓手指跑得沒那么累。

語音則完全是另外一條路。說話這件事,本來就是人類最自然的輸出方式之一。我們從小就學(xué)會(huì)用聲音組織情緒和思想,所有的停頓、轉(zhuǎn)折、插話、反悔,都是在這種流動(dòng)里長出來的。

真正開始高頻用語音和 AI 交互之后,我才發(fā)現(xiàn),所謂「自然輸入方式」不只是速度快一點(diǎn),而是它把我從很多不必要的負(fù)擔(dān)里解放了出來: 不用在意是不是每個(gè)字都敲對(duì),不用提前把句子構(gòu)造好,不用為了照顧輸入法刻意改變自己的表達(dá)習(xí)慣。我可以像和人說話一樣把一件事情講清楚,剩下的交給模型去理解、去整理 。

Typeless 這一類軟件,站在這個(gè)趨勢(shì)上做了一步更激進(jìn)的嘗試。它并不滿足于當(dāng)一個(gè)「語音版鍵盤」,而是很明顯地在向系統(tǒng)級(jí)能力靠攏:在桌面端,它試圖成為一層獨(dú)立于具體 App 之上的輸入層;在 iOS 端,它干脆取消了鍵盤,把「說話」設(shè)定為默認(rèn)動(dòng)作。

在 iOS 端,Typeless 做得非常激進(jìn),直接取消了鍵盤輸入,僅保留語音輸入|圖片來源:極客公園

這種野心讓我看到了一些想象空間:如果有一天,操作系統(tǒng)層真的接受了「語音優(yōu)先」的前提,把類似 Typeless 的能力直接做進(jìn)系統(tǒng),也許我們今天習(xí)慣的很多交互細(xì)節(jié)都會(huì)被改寫。

當(dāng)然,這一切目前都還停留在可能性層面。大公司會(huì)不會(huì)愿意把這件事做到極致,用戶會(huì)不會(huì)接受一套以語音為主的新習(xí)慣,監(jiān)管和隱私會(huì)怎么演化,這些問題誰都說不準(zhǔn)。

對(duì)我來說,唯一可以確認(rèn)的,是它已經(jīng)在「輸入效率」這個(gè)非常具體的指標(biāo)上,給出了一個(gè)足夠有說服力的答案: 在很多場(chǎng)景里,我可以用更短的時(shí)間,把更多的信息、更完整的語義輸入到電腦里,而且中間少了很多和鍵盤搏斗的環(huán)節(jié) 。

哪怕最終 Typeless 沒能長成一個(gè)真正的「系統(tǒng)級(jí)存在」,這部分被釋放出來的效率和注意力,大概也已經(jīng)足夠說明一件事——輸入方式這件事,我們完全有理由重新想象。

熱門文章

0.1189s , 8536.96875 kb

Copyright © 2025 Powered by AI語音輸入法 正在偷偷擠走鍵盤,企業(yè)錄(www.155tp.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶  

sitemap

Top