搜尋結果
BABA +0.00% 阿里巴巴-SW +4.11%. 4月7日,阿里雲通義千問開源320億參數模型Qwen1.5-32B。. 通義千問此前已開源5億、18億、40億、70億、140億和720億參數6款大語言模型。. 此次開源的320億參數模型,將在性能、效率和內存佔用之間實現更理想的平衡,其希望32B開源模型能爲 ...
據介紹,通過輸入文本和15秒音頻樣本,Voice Engine便可以生成一個與音頻中說話者非常相似的自然語音。 新聞稿強調,生成的自然語音具有豐富的情感和逼真的聲音。 OpenAI稱,公司在2022年底就啓動了Voice Engine的研發工作,並將它用作一些其他功能的預設語音。 由於合成語音可能會被濫用,公司只在小範圍內與開發人員分享了該模型,未來可能不會廣泛推出這一功能。
據科技記者馬克・古爾曼最新報道,蘋果正在研發一種運行於設備端的大型語言模型 (LLM) ,旨在提升即將發佈的生成式AI功能的響應速度和隱私保護能力。 他在文中表示, 蘋果的下一件大事:設備上的大型語言模型。 蘋果的LLM將成爲該公司未來生成式人工智能功能的基礎。 不過,由於運行於設備端,蘋果的AI工具在某些情況下可能會遜於直接運行於雲端的競品,但它實現該技術的方式仍然可能是一個遊戲規則的改變者。 與此同時,古爾曼也指出,蘋果可以通過授權使用谷歌等其他AI服務提供商的技術來彌補這一差距。 據悉,蘋果的人工智能技術營銷策略將側重於其如何能切實幫助用戶提升日常生活效率,而非單純強調技術本身的強大性能。 此前,古爾曼就曾爆料稱,蘋果正在探索一些“下一件大事”項目,包括增強現實眼鏡和個人機器人。
來源:華爾街見聞. 報道稱,正式版Llama 3將支持多模態處理,先行推出的兩個小版本則不具備這一能力。. 當地時間週一,科技媒體The Information援引一位 $Meta Platforms (META.US)$ 員工消息報道稱, 該公司計劃在下週推出兩個小型的Llama 3大語言模型(LLM),作爲夏季 ...
Grok 1.5V,號稱是能連接數字世界和物理世界。 除了文本功能,它還能處理文檔、圖標、屏幕截圖和照片之類的各種視覺信息。 很快,所有早期測試者和所有Grok用戶就能用上Grok 1.5V了。 英偉達高級科學家Jim Fan發現了Grok-1.5V的「最大亮點」:在他看來,Grok-1.5V最令人感興趣的,就是解決自動駕駛邊緣案例的潛力。 如果使用語言進行「思維鏈」,幫助汽車分解複雜場景,用規則和反事實進行推理,解釋其決策,Grok-1.5V就能將像素->動作映射提升爲像素->語言->動作。 由此,特斯拉FSD V13就很有可能會理解語言Token!
4月23日下午,人工智能(AI)上市公司商湯科技在上海發佈“日日新SenseNova”5.0多模態大模型系列,採用混合專家(MoE)架構,支持多達10T Tokens中英文與訓練數據,推理合成數據高達數千億Token,推理時上下文窗口可以有效到200K左右,擁有端側擴散和語言模型 ...
“妙想”金融大模型是東方財富旗下自主研發的金融行業大語言模型,依託東方財富互聯網財富管理綜合運營平台的優勢,搭載“懂金融、懂用戶、強數據”的金融生態基因,“妙想”金融大模型憑藉數據特色和算法、算力優勢,搭建起領跑金融行業的模型底座