蘋果和谷歌最近暫停在各自的數(shù)字助理服務(wù)中對部分音頻內(nèi)容進(jìn)行人工分析,此前媒體對這兩家公司的做法進(jìn)行了報(bào)道,引發(fā)了強(qiáng)烈反響。
8月8日消息,據(jù)國外媒體報(bào)道,媒體獲得的內(nèi)部文件、截圖和音頻記錄的緩存顯示,為微軟工作的外包商正在監(jiān)聽Skype用戶通過該應(yīng)用翻譯服務(wù)進(jìn)行的私人對話。雖然Skype方面曾表示,公司可能會分析用戶想要翻譯的通話音頻,以改善聊天平臺的服務(wù)質(zhì)量,但它沒有說其中一些分析將由人工完成。
媒體獲得的Skype音頻包括用戶與愛人比較私密的對話,還有所談?wù)摰闹T如體重減奇怪以及彼此關(guān)系等個人問題。媒體獲得的其他文件顯示,微軟的外包商也在監(jiān)聽用戶對微軟語音助手Cortana發(fā)出的語音指令。
蘋果和谷歌最近暫停在各自的數(shù)字助理服務(wù)中對部分音頻內(nèi)容進(jìn)行人工分析,此前媒體對這兩家公司的做法進(jìn)行了報(bào)道,引發(fā)了強(qiáng)烈反響。
“事實(shí)上,我甚至可以與你們分享其中的一些內(nèi)容,這表明公司在保護(hù)用戶數(shù)據(jù)方面是多么松懈,”一位向媒體提供文件內(nèi)容的微軟外包商表示。
媒體獲取的音頻片段通常很短,持續(xù)時間通常在5到10秒之間。但消息人士稱,其他音頻片段可能更長。
2015年,Skype推出了翻譯服務(wù),讓用戶能夠在電話和視頻通話中獲得近乎實(shí)時的音頻翻譯。在該功能發(fā)布之前,《連線》雜志曾發(fā)表了一篇名為《Skype如何使用人工智能構(gòu)建令人驚嘆的新語言翻譯器》的文章。
該產(chǎn)品也確實(shí)使用了人工智能,在媒體自己進(jìn)行的測試中,翻譯結(jié)果令人印象深刻。但就像許多其他人工智能或機(jī)器學(xué)習(xí)項(xiàng)目一樣,事實(shí)證明,為了改進(jìn)算法本身,有些本該由人工智能完成的工作是由人人工完成的。
根據(jù)附帶的外包商屏幕截圖,媒體獲得的部分音頻聶榮來自Skype的Android應(yīng)用翻譯功能。Skype翻譯服務(wù)的常見問題中解答說,當(dāng)用戶使用這項(xiàng)服務(wù)時,“Skype會收集并使用你的對話來幫助改進(jìn)微軟的產(chǎn)品和服務(wù)。為了幫助翻譯和語音識別技術(shù)的改進(jìn)和發(fā)展,我們會分析句子和錄音,并將更正內(nèi)容輸入我們的系統(tǒng),以構(gòu)建更高效的服務(wù)。”另一個部分補(bǔ)充說,“為了幫助技術(shù)學(xué)習(xí)和發(fā)展,我們會驗(yàn)證自動翻譯并將任何更正反饋回系統(tǒng),以構(gòu)建更高性能的服務(wù)。”
這其中并沒有說有人可以監(jiān)聽Skype各種應(yīng)用程序的翻譯功能所捕捉到的音頻。微軟的隱私政策也沒有明確說明這一點(diǎn)。
“人們用Skype給愛人打電話,面試工作,或者和國外的家人聯(lián)系。隱私國際組織(Privacy International)數(shù)據(jù)開發(fā)項(xiàng)目負(fù)責(zé)人弗雷德里克 卡爾特烏納(Frederike Kaltheuner)在一次在線聊天中表示:“公司應(yīng)該100%公開對人們談話的記錄方式以及使用方式。”
她補(bǔ)充說:“如果你的聲音樣本(無論出于什么原因)要經(jīng)過人工審核,系統(tǒng)應(yīng)該詢問你是否同意,或者至少讓你有拒絕的選擇。”
隱私事務(wù)活動人士帕特 沃爾什(Pat Walshe)在一次在線聊天中表示:“(Skype翻譯)的營銷宣傳語明確指的是使用人工智能,而不是人工監(jiān)聽。整個領(lǐng)域都需要監(jiān)管審查。”
在看過Skype翻譯對常見問題解答后,他補(bǔ)充說,“我已經(jīng)看過了,我不認(rèn)為它等同于透明公平的處理。”
微軟發(fā)言人在一份電子郵件聲明中表示,“微軟收集語音數(shù)據(jù)是為了提供和改進(jìn)語音服務(wù),比如搜索、語音命令、聽寫或翻譯服務(wù)。我們努力在收集和使用語音數(shù)據(jù)方面做到透明,以確保客戶能夠明智地選擇微軟何時以及如何使用他們的語音數(shù)據(jù)。在收集和使用客戶的語音數(shù)據(jù)之前,微軟會獲取客戶的許可。”
“我們還制定了一些程序,旨在與我們的供應(yīng)商共享這些數(shù)據(jù)之前優(yōu)先考慮用戶的隱私,包括個人數(shù)據(jù)去除、要求與供應(yīng)商及其員工達(dá)成保密協(xié)議,并要求供應(yīng)商滿足歐洲法律規(guī)定的最高隱私標(biāo)準(zhǔn)。我們將繼續(xù)審查處理語音數(shù)據(jù)的方式,以確保我們向客戶提供盡可能清楚的選擇和強(qiáng)有力的隱私保護(hù)。”
微軟表示,其Skype翻譯中的常見問題和Cortana文檔都很清楚,該公司使用語音數(shù)據(jù)來改善服務(wù)。不過,他們也沒有說有人可能會聽到這些語音數(shù)據(jù)。
根據(jù)截屏和其他文件,當(dāng)微軟向外包商提供一段音頻進(jìn)行轉(zhuǎn)錄時,他們還會得到一系列由Skype翻譯系統(tǒng)生成的近似翻譯。截圖顯示,隨后,外包商需要選擇最準(zhǔn)確的翻譯內(nèi)容,或者提供自己的翻譯,音頻將被視為微軟的機(jī)密信息。
“我聽到的一些事情可以很清楚地描述為電話**。我聽到有人用Cortana命令輸入完整的地址,或者要求Cortana提供色情查詢的搜索結(jié)果。雖然我不知道人們究竟可以用這些信息做什么,但我覺得奇怪的是,這些信息并沒有在一個受控環(huán)境中處理。”
微軟說,其只是通過安全的在線門戶網(wǎng)站向外包商提供音頻數(shù)據(jù),公司會采取相應(yīng)措施刪除用戶或設(shè)備識別號碼等個人識別信息。
盡管這些信息很敏感,但有部分在家工作的外包商正在收聽和處理Skype和Cortana的音頻。
有外包商說,“一般來說,我覺得雖然我們沒有用戶的個人身份信息,如果微軟用戶意識到有人穿著睡衣坐在家里和網(wǎng)上的朋友就聽到的內(nèi)容大開玩笑,他們是不會喜歡這一點(diǎn)的。”