近日消息,在应对Anthropic和OpenAI等对手的强势竞争之际,谷歌宣布了对其AI聊天助手Gemini实施的重大升级举措。此番革新着重于两方面:优化系统性能与拓宽应用边界。升级亮点包括但不限于更强大的自然语言处理能力、增强的个性化互动体验以及更广泛的领域适应性,力图在生成式AI领域的竞赛中保持领先身位。
多语言支持,全球覆盖
从本周四开始,Gemini1.5Flash(谷歌5月发布的轻量级多模式模型)将在网络和移动设备上支持40种语言,覆盖约230个国家和地区。谷歌表示,Gemini1.5Flash在质量和响应速度方面都有显著提升,尤其是在推理和图像理解方面。
这一升级不仅提高了用户体验,也可能降低谷歌的运营成本。Gemini1.5Flash被描述为Gemini1.5Pro的"精简版"和高效版,专为"窄带"、"高频"生成式AI工作负载而设计。
上下文窗口扩展,文件上传功能
除了新的基础模型,谷歌还将Gemini的上下文窗口扩展到32,000个标记,相当于约24,000个单词(或48页文本)。这意味着Gemini可以处理更长的文本,提供更连贯的对话体验。
更值得注意的是,谷歌即将为所有Gemini用户开放从Google Drive和本地设备上传文件的功能。用户可以上传学习资料,让Gemini创建练习题,甚至分析数据文件并生成可视化图表。
提高透明度,减少"幻觉"
为了应对AI模型可能产生的"幻觉"(即编造虚假信息),谷歌正在测试一项新功能:在Gemini生成的某些答案下方显示相关网页内容的链接。这一举措旨在提高信息的可靠性和透明度。
更广泛的应用场景
谷歌正在将Gemini功能扩展到更多领域:
1. Messages应用集成:Gemini功能将在欧洲经济区(EEA)、英国和瑞士推出,并支持法语、波兰语和西班牙语等新增语言。
2. 手机应用推广:Gemini手机应用将在更多国家推出。
3. 面向青少年开放:Gemini将在全球范围内向青少年开放使用,同时推出专门的入职流程和"AI素养指南"。
谷歌此次对Gemini的全面升级,体现了其在AI领域的雄心和决心。通过提升性能、扩大语言支持、增加新功能并向更广泛的用户群开放,谷歌正努力在竞争激烈的AI市场中保持领先地位。
文明上网,理性发言,共同做网络文明传播者