雅虎香港 搜尋

搜尋結果

  1. 1. 单论 DeepSeek-V2模型 的中文水平(来自20多个 微信群 用户反馈),是真实处在国内外闭源模型的第一梯队(GPT4、 文心4.0 等),因为没做RAG(检索增强)等功能,所以实际在官网( deepseek.com )的体感可能略微没那么惊艳,但这不妨碍 API 效果呐! 外加1元/百万输入 Tokens 的价格,只有GPT4价格的1/100,性价比之王! 2. 怎么兼顾模型效果和成本的? 基本纯靠:模型结构创新(MLA+ DeepSeekMoE )+ 超强Infra。 MLA妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA 。 从今天起,放弃MHA/GQA,全面拥抱MLA吧。

  2. 2024年4月28日 · 江西F4的视频已经传遍全国了,大家都在讨论她们的各种缺点,但我觉得她们有一个共同的优点,那就是她们都不远嫁。

  3. 2024年4月28日 · 不仅为江西高彩礼现象辩护,更从女性觉醒的视角出发,向广大男性同胞发出呼吁,期望他们能够拓宽视野,共… 觉醒姐刚说要独立要觉醒的时候,我真以为她是作为觉醒女性带头反抗江西的高彩礼,为江西女性正名。紧接着觉醒姐呼吁大家睁眼看世界,我更敬佩了,以为她要说世界上绝大多数 ...

  4. 4 天前 · 知乎,中文互联网高质量的问答社区和创作者聚集的原创内容平台,于 2011 年 1 月正式上线,以「让人们更好的分享知识、经验和见解,找到自己的解答」为品牌使命。知乎凭借认真、专业、友善的社区氛围、独特的产品机制以及结构化和易获得的优质内容,聚集了中文互联网科技、商业、影视 ...

  5. 2024年4月27日 · 知乎,中文互联网高质量的问答社区和创作者聚集的原创内容平台,于 2011 年 1 月正式上线,以「让人们更好的分享知识、经验和见解,找到自己的解答」为品牌使命。知乎凭借认真、专业、友善的社区氛围、独特的产品机制以及结构化和易获得的优质内容,聚集了中文互联网科技、商业、影视 ...

  6. 进入知乎. 系统监测到您的网络环境存在异常风险,为保证您的正常访问,请输入验证码进行验证。. 开始验证. 知乎,中文互联网高质量的问答社区和创作者聚集的原创内容平台,于 2011 年 1 月正式上线,以「让人们更好的分享知识、经验和见解,找到自己的 ...

  7. 2024年5月12日 · 放一段我在隔壁的评论. 这个队的比赛我经常看,我觉得 Otto 就是短板. 人菜还嘴硬. 香锅曾经有一句话说的对. 他说“我是指挥,打起来的时候,你们都要听我的,打完复盘如果是我的问题,你们随便喷”. 老头杯第一支被打解散的队伍出现了?. 大顺风被翻盘后 ...