About 23,000,000 results
Open links in new tab
  1. 为什么用 DeepSeek 总是提示「服务器繁忙」?怎么解决? - 知乎

    最近不少被Deepseek新闻吸引过来的AI新手用户发现,国内AI公司深度求索(DeepSeek)的线上服务频繁出现“服务器繁忙”提示,甚至影响正常使用。 这背后其实是一场持续近一个月、愈演 …

  2. 普通人怎样用好Deepseek? - 知乎

    1.DeepSeek目前广义来讲,主要分为V3和R1两种模型,其中V3为对话模型,R1为推理模型. DeepSeek-V3适用于通用知识问答、文本创作和学习辅助,覆盖面广泛,但专业性稍弱。 适用 …

  3. DeepSeek 宣布下周将会陆续开源 5 个代码库,可能会公开哪些信 …

    DeepSeek-v3作为强大的基座模型,语言理解和生成能力极强。 于是,用强大的模型基座能解决RL训练采样效率低的问题,(有点类似于最早alphago,有pre-training的先验知识),基座模 …

  4. 有必要自己将deepseek部署到本地吗? - 知乎

    所以我认为,deepseek部署有可行性就够了,至于有没有必要性,很多人没那么重要。 大家听到openai训练ai需要几千亿美元,让ai推理需要十块H100(一块280万人民币),部署满 …

  5. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    对于流水线并行,DeepSeek-V3设计了类似于Chimera 中的双向流水来降低bubble,而没有采用更加常见的interleaved 1F1B(尽管interleaved 1F1B中的steady阶段同样可以将前向和反向的计 …

  6. 如何把 deepseek-R1 微调或蒸馏为某领域的一个专家? - 知乎

    Deepseek-R1使用教师模型训练时的原始数据集或其子集作为蒸馏数据集。数据集的质量和多样性直接影响蒸馏效果。使用高质量、多样化的数据集可以确保学生模型学习到更全面和准确的推 …

  7. DeepSeek 遭暴力破解,攻击 IP 均来自美国,造成影响有多大?有 …

    Jan 29, 2025 · 最可恨的是,DeepSeek 这波本来是泼天的流量,iOS App Store 双榜登顶,吸引了非常多国内外的新用户。结果这些新用户要么无法注册,要么登录以后不能正常使用。他们还 …

  8. deepseek是可以免费使用的软件吗?如果收费,价格是多少? - 知乎

    使用deepseek时,经常出现“服务器繁忙”的问题。 本文介绍2种新的方法:使用QQ浏览器的deepseek满血版,和腾讯元宝的deepseek。 手机端和电脑端,都能使用。 亲测效果不错。 …

  9. DeepSeek深度思考和联网搜索有什么区别? - 知乎

    Feb 5, 2025 · DeepSeek与其他大模型的协同操作. 我们知道DeepSeek的优势是推理、决策,脑洞大,但劣势也很明显,她多模态能力较弱,且容易产生幻觉,此时我们就可以让DeepSeek给 …

  10. 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? - 知乎

    国内广告学的魅力时刻。 简单来说,就是 DeepSeek-R1 正确的版本应该是: DeepSeek-R1 - 671b F32版本(无量化、无压缩或精度损失处理)(补,经评论区提醒修正为DeepSeek-R1 - …

Refresh