股票投资如何加杠杆:福州配资股票-10倍压缩率、97%解码精度！DeepSeek开源新模型为何赢得海内外关注

来源：tianshengyoupei 网站：在线配资查询机构-具有竞争力的股票配资公司日期：2025-10-22 04:30:08 查看：2

　　DeepSeek开源新模型：用视觉模式实现上下文压缩。

　　10月20日，DeepSeek宣布开源最新大模型DeepSeek-OCR 。所谓的OCR，据DeepSeek在论文中解释称，是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成：DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎，设计为在高分辨率输入下保持低激活，同时实现高压缩比，以确保视觉tokens数量优化且可管理。

　　通俗而言，这是一种视觉-文本压缩范式，通过用少量的视觉token来表示原本需要大量文本token的内容，以此降低大模型的计算开销。

　　据公布的论文名单显示，该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun 、Yukun Li共同完成，但这三位核心作者都颇为低调，其中一作作者Haoran Wei曾在阶跃星辰工作过，曾主导开发旨在实现“第二代 OCR ”的GOT-OCR2.0系统。

　　DeepSeek-OCR的架构分为两部分。一是DeepEncoder ，一个专为高压缩、高分辨率文档处理设计的视觉编码器；二是DeepSeek3B-MoE，一个轻量级混合专家语言解码器。这款刚开源不久的新模型，发布后就得到海外科技媒体广泛赞美，有网友盛赞：“这是AI的JPEG时刻。”

推荐阅读：

北证股票开户有什么条件:买股加杠杆-中企在赞比亚造成污染被索赔800亿美元？中方回应

　　前特斯拉AI总监、OpenAI创始成员安德烈·卡帕西(Andrej Karpathy)在社交媒体高度评价DeepSeek的新模型，他表示，自己相当喜欢新的DeepSeek-OCR论文，“它是一个很好的OCR模型（可能比dots稍微差一点），是的，数据收集等等，但无论如何都不重要。对我来说更有趣的部分（尤其是作为一个以计算机视觉为核心，暂时伪装成自然语言的人）是像素是否比文本更适合作为LLM的输入。作为输入，文本标记是否浪费且糟糕。”

　　根据他的设想，或许所有LLM的输入都只应该是图像。即便是纯文本内容，也应该先渲染成图片再输入给模型，其中理由包括：信息压缩效率更高、像素更通用、支持双向注意力、可淘汰存在安全隐患的分词器（Tokenizer）。

　　特斯拉创始人马斯克（Elon Musk）也现身评论区，并表示：“从长远来看，AI模型超过99%的输入和输出都将是光子，没有其他任何东西可以规模化。 ”

　　知名科技媒体《麻省理工科技评论》解释称，DeepEncoder是整个系统的关键所在。它的设计目标在于，在处理高分辨率输入图像的同时，保持较低的激活内存，并实现极高的压缩比。为达到这一目的，DeepEncoder融合两种成熟的视觉模型架构：SAM（Segment Anything Model）和 CLIP（Contrastive Language–Image Pre-training）。前者以窗口注意力机制（window attention）见长，擅长处理局部细节，构成编码器的前半部分；后者则依赖密集的全局注意力机制（global attention），能够捕获整体知识信息。

　　《麻省理工科技评论》表示，除了文本识别性能，DeepSeek-OCR还具备较强的“深度解析”能力。这得益于其训练数据中包含了图表、化学分子式、几何图形等多样化的视觉内容。因此，模型不仅能识别标准文本，还能对文档中嵌入的复杂元素进行结构化解析。例如，它可以将报告中的图表转换为表格数据，将化学文献中的分子式输出为SMILES格式，或解析几何图形中的线段关系。这种超越传统文本识别的能力，拓展了其在金融、科研、教育等专业领域的应用空间。

　　DeepSeek介绍，实验表明，当文本tokens数量在视觉tokens的10倍以内（即压缩比<10×）时，模型可达到97%的OCR精度。即使在20×压缩比下，OCR精度仍保持在约60%。这为历史长上下文压缩和LLM中的记忆遗忘机制等研究领域展示可观前景。

　　DeepSeek-OCR还初步验证上下文光学压缩的可行性，证明模型可以从少量视觉tokens中有效解码超过10倍数量的文本tokens。DeepSeek-OCR也是一个高度实用的模型，可大规模生产预训练数据，“未来，我们将进行数字-光学文本交错预训练、大海捞针测试等进一步评估，继续推动这一有前景的研究方向。”

　　据海外科技媒体分析，研究团队表示，在基准测试中，DeepSeek-OCR优于多个主流模型，且使用的视觉tokens数量少得多。此外，单张A100-40G GPU每天可生成超过20万页的训练数据，可为大型语言模型和视觉-语言模型的开发提供支持。

　　前网易副总裁、杭州研究院执行院长汪源发文表示，DeepSeek-OCR模型是一个专门能“读懂 ”图片里文字的AI模型。但厉害的地方不是简单“识字”，是采用了一种非常新颖的思路：把文字当成图片来处理和压缩。

　　汪源认为，可以把它想象成一个超级高效的“视觉压缩器”，传统的AI模型是直接“读”文本，但 DeepSeek-OCR 是先“看 ”文本的图像，然后把一页文档的图片信息高度压缩成很少的视觉tokens。DeepSeek-OCR的能力强在能把一篇1000字的文章，压缩成100个视觉tokens。在十倍的压缩下，识别准确率可以达到96.5% 。

你可能想看：

股票投资如何加杠杆:福州配资股票-张江高科：股票价格短期涨幅较大可能存在非理性炒作风险

股票杠杆交易怎么操作:股市加杠杆如何收费的-【今日投资机会】关注日债、美债和期指的深度贴水

股票里加杠杆是什么意思:散户如何给股票加杠杆-迎战Sora 2！谷歌上线视频模型Veo 3. 1 赢面几何？

玩股如何加杠杆:中环再资股票-十大券商策略：散户并非行情推动者！新旧资金正在接力关注盈利改善兑现

股票的股权登记日要如何操作:如何购买杠杆股票-下周关注：多个消费电子新品将发布这些投资机会最靠谱

如何加杠杆炒股指:最专业的股票app-PD-1 PLUS成主角？国产创新药再迎催化这场顶级肿瘤学会议值得关注

杠杆炒股网:在手机上怎么玩股票-马斯克AI大动作曝光！xAI已开源Grok 2.5模型

股票选股app软件:炒股的杠杆是什么意思-AI医疗重磅！华为+瑞金医院宣布开源核心模型概念股曝光

在线配资查询机构-具有竞争力的股票配资公司提示：文章来自网络，不代表本站观点。

相关文章

短期“抢出口”效应仍在，1-2月出口同比增长2.3%

短期“抢出口”效应仍在，1-2月出口同比增长2.3%

【财富周报】央行阶段性暂停在公开市场买入国债，首批自由现金流ETF获批

【财富周报】央行阶段性暂停在公开市场买入国债，首批自由现金流ETF获批

配资:正规的股票配资公司-创兴资源(600193.SH)：担保债务逾期超1200万元，子公司资金压力成焦点

配资:正规的股票配资公司-创兴资源(600193.SH)：担保债务逾期超1200万元，子公司资金压力成焦点

沪深京指数

在线配资查询机构-具有竞争力的股票配资公司

在线配资查询机构-具有竞争力的股票配资公司⑯我们会结合公司内部的资源优势和行业专长，选取特定行业或板块进行深入研究，寻找具有潜力的投资标的。

话题标签

股票配资股票配资炒股配资配资平台股票配资平台配资门户网配资网配资之家配资门户在线配资平台配资开户配资炒股全部话题标签

关注在线配资查询机构-具有竞争力的股票配资公司

在线配资查询机构-具有竞争力的股票配资公司

滚动资讯

网红“大V”不可轻信，抖音打击“非法荐股”等违法证券活动

配资杠杆之家03-11

3月10日，抖音安全中心发布关于打击“非法荐股”等违法证券活动的公告。公告称，抖音致力于打造风清气正的社区环境，...

热点:官网股票配资-4月10日投资早报

配资手机平台04-10

【隔夜行情】•周三（2025年4月9日），A股三大股指集体收涨，截至收盘，上证指数报收3186.81点，涨1.3...

股票:炒股配资网址-国务院新闻办公室发布《关于中美经贸关系若干问题的中方立场》白皮书

配资杠杆之家04-09

国务院新闻办公室9日发布《关于中美经贸关系若干问题的中方立场》白皮书，澄清中美经贸关系事实，阐明中方对相关问题的政策立场...

财经:期货公司低保证金-正式更名！30年国债ETF博时(511130)早盘上涨18个bp，机构：全球避险情绪升温，或利好债市

a股如何杠杆04-11

早盘，国债期货拉升，30年期主力合约涨0.42%，10年期主力合约涨0.12%，5年期主力合约涨0.05%，2年期主力合...

配资:前程策略股票配资-市场反弹优选弹性宽基，科创100/200/综指领涨宽基！鹏华基金深耕布局科创板，提供「宽基+特色行业」多个投资工具

a股如何杠杆04-12

近期美国所谓“对等关税”政策引发全球资产巨震，本周一科技板块调整尤为明显。为了稳定资本市场，汇金、央行等机构稳市打出组合...

推荐资讯

神农集团(605296.SH)：2月公司销售生猪28.14万头，销售收入4.24亿元

神农集团(605296.SH)：2月公司销售生猪28.14万头，销售收入4.24亿元

退市预警

美股大跌，五位参加特朗普就职典礼的富豪财富缩水2090亿美金，马斯克最多

人民币兑美元中间价报7.1696，调升45点