Google在影片中展示的與Gemini的互動並非實時進行的,也不是用語音進行的。這場競賽很快地迎來了反轉,Gemini似乎跌落了神壇。回顧官方的影片,展示了Gemini在推理能力上的進步,能夠預測紙球的移動和識別螃蟹的形狀。然而,在影片發布後不久,Google在底下加上了一段備註,表示與Gemini的對談過程實際上花費的時間比影片中的時間要長,具體的回應時間並未公佈。这篇文章的演示不是实时进行的,也不是用语音进行的。一位Google发言人告诉彭博社,该影片是利用静态照片和文字提示制作而成。此外,他们还揭露开发者是如何使用手部照片、绘画作品或其他物体与Gemini进行互动。换句话说,演示中的声音实际上是在朗读人类制作给Gemini的提示,并向它展示静态图像。这与整部影片呈现的效果完全不同。目前社群媒体上的许多理解,以为人们可以与Gemini进行流畅的语音对话,同时它能即时观察并回应周围环境,然而事实并非如此。
值得一提的是,在AI产品的展示会上,不管是OpenAI、马斯克Grok,目前也都没有实际操作的演练,大部分都是截图或录影,因为AI输出的结果是不一定的,相同的参数与提示词,跑出来的结果可能都大不相同。对此,Gemini共同负责人Oriol Vinyals也发布推文认为展示过程中并没有不当的行为。
很快地,从12月13日起,开发者和企业客户将能够通过Google AI Studio或Google Cloud Vertex AI中的Gemini API存取Gemini Pro。此外,Android开发人员也将能够使用Gemini Nano进行应用程序的开发和建置,到时候「Gemini」是否能够成为超越GPT-4的杀手级产品,正受全世界关注。