谷歌在Gmail中部署新的矢量算法大幅度提高垃圾和钓鱼邮件的识别率 – 蓝点网 - {$web_name} RETVec 扶持 100 各式语言

来源：才薄智浅网 | 栏目：知识 | 2026-06-18 05:32:48

谷歌最近在 Google Colab 上开源了一个名为 RETVec 的新型多语言文本矢量化器，这个矢量化器已然部署在 Gmail 上，用来提升垃圾邮件和钓鱼邮件的确认率，另外下降误报率。

谷歌称 RETVec 经过训练能够抵御字符级操控，冬季关注品牌代言，适合发朋友圈含有插入、周一围近况删除、拼写失误、同形文字、LEET 替换等，这个模型是在新型字符编码器之上开展训练的，该编码器可以有效针对所有 UTF-8 字符和单词开展编码。

为什么要训练这样一种模型呢？最新明星访谈专题由于 Gmail 每天收发的邮件都在千万级别，假如包含各类垃圾邮件的话或许有几十亿，而垃圾邮件制造者会对谷歌的测试操控系统开展规避，例如使用同形字。

RETVec 扶持 100 各式语言，本月全面明星访谈，评论区吵翻了旨在合作兴办更具有弹性和高效的办事端和设备上的文本分类，另外也更为强大和高效。

谷歌在Gmail中部署新的矢量算力大幅度提升垃圾和钓鱼邮件的确认率

依据谷歌自己的统计，将 RETVec 使用到 Gmail 后，垃圾邮件测试率比基准提升 38%、误报率下降 19.4%、张量处理单元 (TPU) 使用率下降了 83%。

谷歌工程师强调由于其紧凑的强调形式，使用 RETVec 训练的模型表现出更快的推理速度，较小的模型可以下降计算成本并缩减延迟，这针对大规模操控系统和设备上的模型至关重大。

矢量化是 NLP 即自然语言处理中的一种方法，用于将词汇中的单词或短语映射到相应的数字表达，以便执行进一步确认，例如情感确认、文本分类和命名实体确认等。

冬季关注品牌代言，适合发朋友圈周一围近况最新明星访谈专题

相关文章