DeepSeek

來自中國科技網的圖片

DeepSeek深度求索是一家創新型科技公司，專注於大語言模型算法的研發與應用。

簡介

DeepSeek，全稱杭州深度求索人工智能基礎技術研究有限公司，成立於2023年7月17日，是一家創新型科技公司，專注於開發先進的大語言模型（LLM）和相關技術。註冊地位於浙江省杭州市拱墅區環城北路169號匯金國際大廈西1幢1201室，法定代表人為裴湉。

DeepSeek的經營範圍包括技術服務、技術開發；軟件開發等。2024年1月5日，發布DeepSeek LLM，這是深度求索的第一個大模型。2024年1月25日，發布DeepSeek-Coder。2024年2月5日，發布DeepSeekMath。2024年3月11日，發布DeepSeek-VL。[10]2024年5月7日，發布DeepSeek-V2。2024年6月17日，發布DeepSeek-Coder-V2。2024年9月5日，DeepSeek官方更新API支持文檔，宣布合併DeepSeek Coder V2和DeepSeek V2 Chat兩個模型，升級推出全新的DeepSeek V2.5新模型。2024年12月13日，發布用於高級多模態理解的專家混合視覺語言模型——DeepSeek-VL2。2024年12月26日晚，AI公司深度求索（DeepSeek）正式上線全新系列模型DeepSeek-V3首個版本並同步開源。12月30日，中信證券研報指出，DeepSeek-V3的正式發版引起AI業內廣泛高度關注，其在保證了模型能力的前提下，訓練效率和推理速度大幅提升。

中信證券研報評價DeepSeek-V3，「DeepSeek新一代模型的發布意味着AI大模型的應用將逐步走向普惠，助力AI應用廣泛落地；同時訓練效率大幅提升，亦將助力推理算力需求高增。我們持續看好AI產業鏈的加速落地機遇，建議重點關注AI應用、AI Infra、AI算力三大主線。」

DeepSeek的大語言模型算法於2024年4月上線，該算法以Transformer架構為基礎，是自主研發的深度神經網絡模型。該模型基於注意力機制，通過海量語料數據進行預訓練，並經過監督微調、人類反饋的強化學習等進行對齊，能夠實現語義分析、計算推理、問答對話、篇章生成、代碼編寫等多種任務。

DeepSeek在近期發布了開源多模態模型Janus-Pro，這是其此前發布的JanusFlow大模型的高級版本。Janus-Pro在多模態理解和文本到圖像的指令跟蹤功能方面都取得了重大進步，同時還增強了文本到圖像生成的穩定性。在GenEval和DPG-Bench基準測試中，Janus-Pro擊敗了Stable Diffusion和OpenAI的DALL-E 3‌2。

此外，DeepSeek的線上服務在近期受到了大規模惡意攻擊，導致平台註冊繁忙。為了應對這一情況，DeepSeek暫時限制了+86手機^[1]號以外的註冊方式，但已註冊用戶可以正常登錄。多家科技媒體認為，DeepSeek可能遭遇了「分布式拒絕服務攻擊」(DDos)‌3。

DeepSeek的快速發展和創新引起了國內外的廣泛關注。其表現震驚了扎克伯格，微軟納德拉也稱其發展非常迅速，計算效率極高。ChatGPT甚至回應被DeepSeek超越，表示排名也許是暫時的。DeepSeek的崛起對美股市場也產生了影響，英偉達股價大跌，市值蒸發近5900億美元‌4。

總的來說，DeepSeek是一家在AI領域具有強大實力和創新能力^[2]的科技公司，其大語言模型算法和多模態模型的應用前景廣闊，備受業界關注。

視頻

DeepSeek 相關視頻

Deepseek：領航AI新紀元，共繪智能化璀璨篇章 DeepSeek：中國AI力量的崛起與全球科技格局的重塑

參考文獻

移至 ↑ 手機里的智能健康，搜狐，2019-05-04
移至 ↑ 2017教師招聘——如何培養學生的創新能力，搜狐，2017-03-13

[1] 移至 ↑ 手機里的智能健康，搜狐，2019-05-04

[2] 移至 ↑ 2017教師招聘——如何培養學生的創新能力，搜狐，2017-03-13

[1]

[2]

DeepSeek

目錄

簡介

視頻

DeepSeek 相關視頻

參考文獻