Januspro
![]() |
JanusproJanus pro,Janus Pro是DeepSeek發布的一款多模態大模型,主要用於文本到圖像[1]的生成及多模態理解。
簡介
發布時間與背景
Janus Pro由DeepSeek在2025年1月28日凌晨發布,標誌着DeepSeek正式進軍文生圖領域。
模型特點與改進
Janus Pro是2024年11月13日發布的JanusFlow大模型的高級版本,優化了訓練策略、擴展了訓練數據,並且模型規模更大。
Janus Pro在多模態理解和文本到圖像的指令跟蹤功能方面取得了重大進步,同時增強了文本到圖像生成的穩定性。
性能表現
在GenEval和DPG-Bench基準測試中,Janus Pro擊敗了Stable Diffusion和OpenAI的DALL-E 3等其他對比模型,表現出色。
Janus Pro-7B的準確率測試結果分別為80%和84.2%,高於包括OpenAI DALL-E 3在內的其他模型3。
開源與商業應用
Janus Pro採用MIT開源協議,可以無限制地用於商業場景4。
Janus系列的4款模型已經開源,包括Janus-Pro的不同版本12。
額外功能
除了文本到圖像的生成,Janus Pro還能對圖片進行描述、識別地標景點、識別圖像中的文字,並對圖片中的知識進行介紹。
技術文檔與資源
Janus Pro的技術文檔和相關資源可以在DeepSeek的GitHub頁面和Hugging Face頁面上找到5。
綜上所述,Janus Pro是一款功能強大、性能卓越的多模態大模型,適用於多種應用場景,包括文本到圖像的生成、圖像識別[2]、地標識別等。
參考文獻
- 移至 ↑ 圖像基本概念「平面設計基礎一」,搜狐,2018-09-20
- 移至 ↑ 圖像識別,這幾款軟件簡單好用!,搜狐,2024-06-04