About 10,700,000 results
Open links in new tab
  1. Chatbot是什么? - 知乎

    chatbot是这一两年最火的话题,是自然语言处理“王冠上的钻石”。 chatbot本身是一个很难的问题,商业与技术上套路都貌似飘忽不定。到底什么是C… 显示全部

  2. 如何从零基础开始学习做一个基于人工智能的chatbot聊天机器人?

    May 17, 2019 · 在“ 开源对话系统架构 ”里面,我们介绍了Rasa与Deeppavlov作为Chatbot的框架。 Rasa与Deeppavlov作为核心的对话智能架构,最好2者能够融合起来使用。 但是对话理解其实是商用Chatbot的核心能力NLU之一, 外围还有非常多的工作要做。

  3. 如何高效使用Chatbot? - 知乎

    如何高效使用Chatbot? ChatBot的应用场景非常广泛,包括语音助手、客服机器人、文本摘要、推荐系统、自动写作、机器翻译、情感分析、舆情监测等多个领域。

  4. 目前大语言模型的评测基准有哪些? - 知乎

    的 Chatbot Arena 呀! Chatbot Arena 是基于社区评价的大模型评测基准。 上线一年来,Chatbot Arena 已经有超过 65 万次有效用户投票。 Chatbot Arena 见证大模型的快速进化 最近的一个月,我们在 Chatbot Arena 上见证了几件非常有趣的事情:

  5. 国外评测 DeepSeek-V3 超越了迄今为止所有开源模型,DeepSeek …

    DeepSeek-V3在最常用的大模型评测榜“ChatBot Arena”或者说lmarena上出分了。 最新的评分是总成绩第7、开源第1、国产第1。 作为一个550万美元成本的开源大模型,这个成绩非常棒! 榜单地址: lmarena.ai/

  6. 从产品完整性的角度浅谈chatbot - 知乎

    现在似乎每家公司都开始推出自己的一个 chatbot,但是我们都知道一个chatbot想做好,涉及很多复杂的技术。对于普通学生党来说,可能想做出一个工业级产品的chatbot基本不太可能。而且另一方面如何从产品化和架构的角度来整体考虑问题,而不只是一个技术模型的堆砌,这我个人认为也 …

  7. deepspeek和其他国产模型相比有哪些过人之处,许多业内人士都 …

    至于与其他模型的比较,近期DeepSeek-V3在最常用的大模型评测榜“ChatBot Arena”或者说lmarena上出分了。 最新的评分是总成绩第7、开源第1、国产第1。

  8. 如何看待Chatbot Arena上新出的GPT2-chatbot, 目测超越GPT4?

    Apr 29, 2024 · 如何看待Chatbot Arena上新出的GPT2-chatbot, 目测超越GPT4? 刚才看到chatbot-arena上刚刚新出了一个gpt2-chatbot, 盲选的第一次遇到就能明显发现不对劲, 这个不知名的llm却有着无可挑剔的… 显示全部 关注者 239 被浏览

  9. 有哪些大模型榜单值得看?如何判断它们的权威性和客观度? - 知乎

    与Chatbot Arena Elo分数的相关性(y 轴)和评估单个GPT-3.5-Turbo-0125模型的总成本(x 轴)。 MixEval和MixEval-Hard在常用评测中与Arena Elo和Arena Elo(En)表现出最高的相关性。 Chatbot Arena的成本过高,而MixEval和MixEval-Hard是低开销且高性能的替代方案。

  10. 如何评估LLM? - 知乎

    Chatbot Arena 的原理是用3种不同的方法对模型进行评测: 标准测试,比如MMLU。 这类测试是最客观,最容易评测的;但是缺点很明显:如果一个模型“不小心”或者“故意”地把测试集或者相似的数据加入到模型训练中,标准测试的评分就会大幅偏高。