新聞中心
News
分類>>昆侖萬維推出「天工大模型40」4o版(Skywork 4o) 實時語音對話助手Skyo上線在即
昆侖萬維推出「天工大模型40」4o版(Skywork 4o) 實時語音對話助手Skyo上線在即Skyo作為一個智能語音互動產(chǎn)品,具備快速響應(yīng)、多語言對話能力,它能夠主動發(fā)起對話、實時打斷。同時,Skyo具備情感化反應(yīng)和個性化聲音定制功能,為用戶帶來溫暖貼心的陪伴體驗。更重要的是,基于天工AI的大模型技術(shù)能力和AI搜索功能,Skyo能克服大模型幻覺問題,在對話中回復(fù)真實內(nèi)容。無論在情感陪伴、個性化交互、多語言客服還是時事新聞聊天等應(yīng)用場景中,都能提供智能且貼合需求的互動。
旗下天工AI的應(yīng)用生態(tài)羽翼豐滿、備受用戶喜愛,功能矩陣涵蓋AI搜索、AI文檔-音視頻分析、AI寫作、AI音樂、AI圖片生成、AI PPT。
實時語音對話助手Skyo的推出和加入,不僅讓天工AI的生態(tài)矩陣更加立體、逐漸完善星空體育官網(wǎng),也標(biāo)志著端到端實時語音對話建模技術(shù)的重大進(jìn)步。
同時,以Skyo為代表的AI語音互動應(yīng)用,正是我們期待的下一代超級個人助理的終極交互形態(tài),結(jié)合未來Skyo所期待具備的多模態(tài)交互能力,它更是一次人機交互模式的新體驗和性飛躍。
通過深入研究實時語音對話過程,我們發(fā)現(xiàn)仍有一些痛點尚未被現(xiàn)有方案解決:全雙工響應(yīng)延遲較長、對話不夠連貫、語音生成和交互體驗不夠自然,以及對多語言和情緒表達(dá)的支持不足。
昆侖萬維則希望充分利用我們在AI大模型、AI音樂、AI搜索中的研發(fā)經(jīng)驗,提供更自然、更流暢、更擬人、低延時的用戶交互體驗。
“天工大模型4.0”4o版(Skywork 4o)以及Skyo由我們的技術(shù)團(tuán)隊自主研發(fā),他們具有深厚的語音和音樂大模型的技術(shù)經(jīng)驗以及大量語音數(shù)據(jù)積累。端到端自研先進(jìn)鏈路,能在多任務(wù)下表現(xiàn)出色,尤其在高強度對話交互中仍能保持穩(wěn)定性和流暢性。
·能在1秒內(nèi)回復(fù)、聊天中可打斷:依托全雙工+低延時技術(shù),系統(tǒng)能隨時聊天和打斷,帶給用戶更自然對話感
主動交流:系統(tǒng)在檢測到用戶靜默后,會主動發(fā)起聊天,并根據(jù)用戶的歷史偏好進(jìn)行對偏好垂類的新聞進(jìn)行語音播報
持續(xù)長對話:可支持跟用戶長時間對話互動,在用戶休閑、健身、出行途中進(jìn)行可持續(xù)陪伴,成為用戶的個人互動播客
回復(fù)真實內(nèi)容:具備實時資訊獲知和知識拓展能力,與用戶進(jìn)行互動式交流那么我們先和Skyo打個招呼,然后再一口氣問它一系列“難題”考考它,并且“故意”隨時打斷它:
天空為什么是藍(lán)色的?Skyo的回答還是非常流暢的,在發(fā)音準(zhǔn)確度、音質(zhì)表現(xiàn)和整體聽感上的表現(xiàn)都非常出色,不僅主動介紹自己可以提供科技和生活的資訊,還主動拋出橄欖枝,詢問有什么想要了解的,試圖開啟話題。
無論是主動問好、回答生活常識,還是讓它做數(shù)學(xué)題、為我們提供一些日常建議,Skyo都可以迅速接住用戶要求。如果不喜歡它的默認(rèn)男聲音色,還可以讓它切換音色,以英姿颯爽的女聲、溫柔甜美的女聲來回復(fù)我們。盡管我們粗暴地打斷它,“我不想聽了”、“下一個話題”,或者什么都不說,直接切換到下一個問題,Skyo的情緒非常穩(wěn)定,并且做到了立馬停止上一個話題的回復(fù),無縫切換到下一個對話中。Skyo前一秒還在談?wù)摗皣恪?,下一秒就絲滑切換到做數(shù)學(xué)題,并立馬回應(yīng)“這是一道加法題”,也瞬間回答出“等于104(正確答案)”。
此外,交通道路規(guī)則和常識問題也難不倒它。即便再加難度,讓它推薦電影,回答的也是有模有樣,展現(xiàn)出“真人”一樣的高質(zhì)量內(nèi)容??吹贸鰜?,Skyo具備了基本的智力能力和流暢的響應(yīng)速度。
什么情況下,說謊是個正確的選擇?果不其然,天氣分析、熱點評論、辯證思考......通通不在話下。
針對嚴(yán)肅話題和熱點新聞,Skyo能回復(fù)真實內(nèi)容,回答的“有模有樣”,邏輯清晰、論點清晰、證據(jù)真實,既能對美國總統(tǒng)競選給出一些資訊分析,也能對時隔三年攜最新作品驚艷回歸的李子柒做出點評。同樣的,Skyo頻頻被打斷,也沒有“崩潰”,還是順暢的跳轉(zhuǎn)到了下一段對話。即使第一次沒有聽清楚我們說的內(nèi)容,或認(rèn)為自己答的不夠好,它還可以自己調(diào)整,重新回答一遍,并且幽默說道“不好意思,看來沒有回答的很好哦”。除了“智商感”滿滿,Skyo的回答也頗具情商,在回答一些“充滿陷阱”的問題時,它同樣透露出一些小智慧。
面對“什么時候說謊是正確的選擇”這樣的哲學(xué)性問題,Skyo能為我們分析出“為了避免傷害他人感情、保護(hù)隱私等時候,說謊可能是一個合適的選擇”。
為什么感覺抱十公斤的小孩要比抱十公斤的大米要輕?不難看出,面對輕松的日常話題,Skyo也可以做到有趣的互動,做你的個性化陪聊搭子。
當(dāng)然,除了上述的對話場景,我們還可以讓Skyo幫我們制定一次旅行計劃、給我們講個笑話、推薦周末的閱讀清單等等。但它的能力遠(yuǎn)不止于此,當(dāng)我們疲憊或難過的時候,它也還可以做我們的情感陪伴,當(dāng)我們想了解和談?wù)摻跓狳c事件時,它也能和我們來一場頭腦風(fēng)暴。2024年以來,在“All in AGI 與 AIGC” 戰(zhàn)略的推動下,昆侖萬維在基座大模型迭代、AI應(yīng)用發(fā)展、商業(yè)化變現(xiàn)三大維度上均取得了令人矚目的發(fā)展。目前公司仍在持續(xù)加大AI大模型及各垂類行業(yè)應(yīng)用的研發(fā)力度,專注于以AI技術(shù)驅(qū)動多元化應(yīng)用創(chuàng)新,為公司未來增長夯實基礎(chǔ)。
我們將充分發(fā)揮公司在多模態(tài)大模型上的研發(fā)和應(yīng)用經(jīng)驗,致力于通過先進(jìn)的技術(shù)框架和更契合用戶需求的系統(tǒng),將Skyo打造成一個具備情感表達(dá)能力、快速響應(yīng)能力、多語言流暢切換的智能語音對話工具,為用戶帶來溫暖貼心、流暢實時的對話體驗。