英伟达今日宣布,英伟迎版I语音识旗下AI聊天机器人ChatRTX进行0.3版本更新,本更别此次更新不仅增加了对谷歌的新新Gemma、ChatGLM3和OpenAI的增照CLIP等多种人工智能模型的支持,还首次集成了先进的片搜Whisper语音识别系统,为用户带来前所未有的英伟迎版I语音识智能交互体验。
英伟达今年三月曾公开AI聊天机器人ChatRTX,新新使用者可以在有着英伟达RTX技术支援的增照Windows PC和工作站上,与储存在本地端的片搜资料互动。ChatRTX利用检索增强生成、英伟迎版I语音识英伟达TensorRT-LLM软体与英伟达RTX加速等技术,本更别将聊天机器人功能带至有着RTX技术支援的新新Windows PC和工作站上。在LLM的增照支援下,使用者可以透过ChatRTX查询他们的片搜笔记和档案,且由于ChatRTX在使用者装置本机端运行,能够快速生成相关回应。
英伟达表示,最新版本加入支援其他LLM,包括由谷歌训练出最新的开放式、可在本地端运行的Gemma。Gemma是Google使用与自家Gemini模型相同的研究和技术,专为负责任AI开发而打造的模型。ChatRTX现在也支援基于通用语言模型框架的开放式中英双语ChatGLM3大型语言模型。
英伟达指出,由于支援OpenAI的对比语言和影像预训练技术,使用者能与影像资料进行互动。经过训练和细化后的CLIP神经网络,从自然语言监督中学习视觉概念。也就是说,这个模型会辨识在影像集里「看到」的东西。因ChatRTX支援CLIP,使用者可透过单字、术语和短语,与装置本机端的相片和影像进行互动,无需使用复杂的诠释资料标记。
另外,新版本的ChatRTX还让使用者可以用自己的声音与资料进行聊天。由于有支援使用AI处理口语的自动语音识别系统Whisper,使用者可以在应用程式上用语音进行查询,ChatRTX将以文字加以回应。这意味着用户不再局限于键盘输入,而是可以通过简单的语音指令来与机器人交互,查询本地数据,享受更为自然和高效的沟通方式。