英伟达ChatRTX迎0.3版本更新新增照片搜索、AI语音识别等功能

发布时间：2024-11-15 23:55:45

英伟达今日宣布，英伟迎版I语音识旗下AI聊天机器人ChatRTX进行0.3版本更新，本更别此次更新不仅增加了对谷歌的新新Gemma、ChatGLM3和OpenAI的增照CLIP等多种人工智能模型的支持，还首次集成了先进的片搜Whisper语音识别系统，为用户带来前所未有的英伟迎版I语音识智能交互体验。

英伟达ChatRTX迎0.3版本更新新增照片搜索、本更别AI语音识别等功能

英伟达今年三月曾公开AI聊天机器人ChatRTX，新新使用者可以在有着英伟达RTX技术支援的增照Windows PC和工作站上，与储存在本地端的片搜资料互动。ChatRTX利用检索增强生成、英伟迎版I语音识英伟达TensorRT-LLM软体与英伟达RTX加速等技术，本更别将聊天机器人功能带至有着RTX技术支援的新新Windows PC和工作站上。在LLM的增照支援下，使用者可以透过ChatRTX查询他们的片搜笔记和档案，且由于ChatRTX在使用者装置本机端运行，能够快速生成相关回应。

英伟达表示，最新版本加入支援其他LLM，包括由谷歌训练出最新的开放式、可在本地端运行的Gemma。Gemma是Google使用与自家Gemini模型相同的研究和技术，专为负责任AI开发而打造的模型。ChatRTX现在也支援基于通用语言模型框架的开放式中英双语ChatGLM3大型语言模型。

英伟达指出，由于支援OpenAI的对比语言和影像预训练技术，使用者能与影像资料进行互动。经过训练和细化后的CLIP神经网络，从自然语言监督中学习视觉概念。也就是说，这个模型会辨识在影像集里「看到」的东西。因ChatRTX支援CLIP，使用者可透过单字、术语和短语，与装置本机端的相片和影像进行互动，无需使用复杂的诠释资料标记。

另外，新版本的ChatRTX还让使用者可以用自己的声音与资料进行聊天。由于有支援使用AI处理口语的自动语音识别系统Whisper，使用者可以在应用程式上用语音进行查询，ChatRTX将以文字加以回应。这意味着用户不再局限于键盘输入，而是可以通过简单的语音指令来与机器人交互，查询本地数据，享受更为自然和高效的沟通方式。