下一代人工智慧可穿戴裝置的競賽已經開始,讓我們來看看Meta、Google、微軟、OpenAI、Apple等科技巨頭在這方面的工作。以下是根據The Information報導整理的資訊。
Google:拿破崙回不到滑鐵盧了
OpenAI:Altman一直有開發硬體的野心
Microsoft:小模型開路,正在為HoloLens開發AI軟體
Apple:硬體有了,模型……
Meta:年輕人跑得快
Amazon:一款支援多模態AI的新裝置即將推出
科技巨頭們一致認為AI需要新的硬體平臺,而可穿戴裝置特別是智慧眼鏡成為他們最大的希望。Meta、Google、微軟、OpenAI等AI領域的領先公司,希望將旗下的視覺和語言相關的AI技術應用於智慧眼鏡和其他帶攝影鏡頭的可穿戴裝置中。
雖然智慧可穿戴裝置已經存在多年,但多模態AI的突破性進展讓這些科技巨頭重新對這一領域充滿信心。多模態AI不僅能識別文字和聲音,還能識別圖片、表格、物體、手勢等視覺內容。最近的例子之一是OpenAI正在考慮將GPT-4 Vision的物體識別功能植入Snapchat的智慧眼鏡中。
雖然將這些技術應用於可穿戴和移動裝置上還需要時間,但這一進步預示著未來可能出現的語音啟用AI助手,這些助手能夠實現科幻電影《Her》中的場景,為我們的日常生活帶來革命性的變化。無論是幫助學生寫論文、解答數學問題,還是提供周圍環境的資訊,這些助手的功能都將超越今日的智慧手機。
正如蘋果前工程經理Pablo Mendes所說,AI模型將成為我們生活中不可或缺的一部分,不僅將融入我們的電腦和手機,還會出現在更多裝置中。他認為,這一切離我們並不遙遠。
儘管Google將小尺寸模型整合到智慧手機中,但其他公司正在探索將技術應用於全新型別的裝置。例如,Meta展示了與雷朋聯合開發的智慧眼鏡,搭載了一個多模態AI語音助手的demo版本。這個智慧助手能夠描述佩戴者所看到的內容,推薦搭配服裝,還能將西班牙文字翻譯成英文。
亞馬遜Alexa AI團隊也在討論一個新的AI裝置,同樣具備視覺識別功能。
科技巨頭們對於帶攝影鏡頭的可穿戴裝置有著執念。Google、微軟一直在努力開發AR頭顯,但目前的光學技術限制了這一能力的普及。蘋果計劃明年推出的Vision Pro頭像搭載了一些AR功能,但初期可能並不會配備多模態AI。
然而,大模型的出現改變了一切。多模態大模型的出現使得未來的AI能夠通過攝影鏡頭觀察佩戴者的行為並進行分析和評論。但要將這些大模型縮小到足以在隨身裝置上高效執行和快速響應,仍然面臨著許多挑戰。
此外,可穿戴裝置上的攝影鏡頭是否能夠被社會所接受,也存在著隱私和道德的問題。
以上就是一些頂級科技巨頭和AI開發者為實現這些產品所做的工作。希望這些資訊能對您有所幫助!