谷歌新的GeminiAI模型现在可以直接收听音频文件
好的,在过去的一年半里,我们见证了生成式人工智能的快速增长(它正在接管世界吗?),正如我们所说,人工智能模型正在获得越来越多的知识。现在,AndroidHeadlines报道称,谷歌的新AI模型Gemini1.5Pro现在可以收听音频了。
也许你知道,但你向人工智能提供的数据越多,它就会变得越好(如果你是持怀疑态度的人之一,那就更奇怪了)。最初,人工智能模型的训练基本上是通过文本完成的——对于聊天机器人来说尤其重要。然而,人工智能模型随后学会了处理图像数据,现在可以用于重建图像(或根据您的提示创建全新图像)。
Gemini(以前被称为Bard,对于那些不知道的人来说)已经能够处理图像,现在它正在向音频格式发展。具有此功能的版本Gemini1.5Pro目前正在测试中。这打开了一个充满可能性的世界——比如长主题演讲、对话、财报电话会议、讲座和类似事物的摘要。您将能够将文件上传到Gemini。
存在总结长时间通话的工具。但他们所做的是先转录通话内容,然后进行总结。然而,双子座会听从召唤。
不过,先别兴奋——目前,这还不会公开发布。为了使用它,您需要Google的开发平台VertexAI,或者如果您使用的是AIStudio。它也一定会向公众公开,但我们不知道什么时候。
总而言之,见证人工智能的发展是非常令人兴奋的。如果您是担心有一天它会统治世界的人之一,请不要太害怕。在我看来,它的存在是为了让我们的生活更轻松,并为我们提供更多空间来发挥我们作为聪明、直觉和创造力人类的潜力。它只会确保我们不必把宝贵的时间浪费在无聊的事情上(比如听长篇财报电话会议,你知道)。