求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

DeepSeek

事實揭露 揭密真相
前往: 導覽搜尋

來自 中國科技網 的圖片

DeepSeek深度求索是一家創新型科技公司,專注於大語言模型算法的研發與應用。

簡介

DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立於2023年7月17日,是一家創新型科技公司,專注於開發先進的大語言模型(LLM)和相關技術。註冊地位於浙江省杭州市拱墅區環城北路169號匯金國際大廈西1幢1201室,法定代表人為裴湉。

DeepSeek的經營範圍包括技術服務、技術開發;軟件開發等。2024年1月5日,發布DeepSeek LLM,這是深度求索的第一個大模型。2024年1月25日,發布DeepSeek-Coder。2024年2月5日,發布DeepSeekMath。2024年3月11日,發布DeepSeek-VL。[10]2024年5月7日,發布DeepSeek-V2。2024年6月17日,發布DeepSeek-Coder-V2。2024年9月5日,DeepSeek官方更新API支持文檔,宣布合併DeepSeek Coder V2和DeepSeek V2 Chat兩個模型,升級推出全新的DeepSeek V2.5新模型。2024年12月13日,發布用於高級多模態理解的專家混合視覺語言模型——DeepSeek-VL2。2024年12月26日晚,AI公司深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V3首個版本並同步開源。12月30日,中信證券研報指出,DeepSeek-V3的正式發版引起AI業內廣泛高度關注,其在保證了模型能力的前提下,訓練效率和推理速度大幅提升。

中信證券研報評價DeepSeek-V3,「DeepSeek新一代模型的發布意味着AI大模型的應用將逐步走向普惠,助力AI應用廣泛落地;同時訓練效率大幅提升,亦將助力推理算力需求高增。我們持續看好AI產業鏈的加速落地機遇,建議重點關注AI應用、AI Infra、AI算力三大主線。」

DeepSeek的大語言模型算法於2024年4月上線,該算法以Transformer架構為基礎,是自主研發的深度神經網絡模型。該模型基於注意力機制,通過海量語料數據進行預訓練,並經過監督微調、人類反饋的強化學習等進行對齊,能夠實現語義分析、計算推理、問答對話、篇章生成、代碼編寫等多種任務。

DeepSeek在近期發布了開源多模態模型Janus-Pro,這是其此前發布的JanusFlow大模型的高級版本。Janus-Pro在多模態理解和文本到圖像的指令跟蹤功能方面都取得了重大進步,同時還增強了文本到圖像生成的穩定性。在GenEval和DPG-Bench基準測試中,Janus-Pro擊敗了Stable Diffusion和OpenAI的DALL-E 3‌2。

此外,DeepSeek的線上服務在近期受到了大規模惡意攻擊,導致平台註冊繁忙。為了應對這一情況,DeepSeek暫時限制了+86手機[1]號以外的註冊方式,但已註冊用戶可以正常登錄。多家科技媒體認為,DeepSeek可能遭遇了「分布式拒絕服務攻擊」(DDos)‌3。

DeepSeek的快速發展和創新引起了國內外的廣泛關注。其表現震驚了扎克伯格,微軟納德拉也稱其發展非常迅速,計算效率極高。ChatGPT甚至回應被DeepSeek超越,表示排名也許是暫時的。DeepSeek的崛起對美股市場也產生了影響,英偉達股價大跌,市值蒸發近5900億美元‌4。

總的來說,DeepSeek是一家在AI領域具有強大實力和創新能力[2]的科技公司,其大語言模型算法和多模態模型的應用前景廣闊,備受業界關注。

視頻

DeepSeek 相關視頻

Deepseek:領航AI新紀元,共繪智能化璀璨篇章
DeepSeek:中國AI力量的崛起與全球科技格局的重塑

參考文獻