南方新闻网再获两项国家发明专利,构筑语义识别和文本纠错核心能力

【来源:南方网】

原标题:南方新闻网再获两项国家发明专利,构筑语义识别和文本纠错核心能力

(记者/马菁璟 郑捷)近日,南方新闻网再获两项国家发明专利,标志着南方新闻网在中文语义识别和文本纠错领域的数字化、智能化能力再次取得突破性进展。

南方新闻网此次获得授权的发明专利分别为“基于句法分析的条件类错误识别方法”和“基于句法分析的句子语法纠错方法”,是南方新闻网与哈尔滨工业大学开展产学研合作的技术创新成果。这两项发明专利是自然语言处理技术在内容信息生产领域的成果应用,已集成进入南方新闻网自主研发的“内容安全卫士”“南方融媒数字平台”等智能化数字化服务产品中,通过云端方式为机构用户提供信息内容智能生成、智能校对、扫描纠错等服务,为信息内容数字化生产和智能校对提供更有力的技术支撑。

目前,中文文本纠错主要包括对拼写错误和语法错误的纠错。其中,条件类错误是拼写错误中比较复杂的一类,其识别主要依赖上下文信息,南方新闻网“基于句法分析的条件类错误识别方法”专利,能从句法角度更好地分析句子信息,提升句子中条件类错误的识别准确性,极大提高流水线系统中纠错的效率。此前,中文语法错误难以通过大规模的预训练进行纠正,南方新闻网“基于句法分析的句子语法纠错方法”专利,通过构建句法分析的预训练模型,提高计算机对句子语法纠错的准确性。

近年来,南方新闻网以建设科技型主流网络媒体为战略目标,坚持“新闻立网、技术强网、创新兴网”发展理念,深入实施“内容+技术+服务”驱动发展战略,不断完善“自主创新+开放创新”相结合的技术研发体系建设,夯实数字化技术底座,瞄准媒体迫切需要和市场迫切需求的信息技术领域开展核心技术攻关,已取得66个国家发明专利和软件著作权。

其中,南方新闻网内容安全卫士通过自主研发的“多维知识图谱+自然语言语义+图像识别”技术,实现多媒体内容的安全检测,产品查错准确率、精准度在业内遥遥领先,为超过6000家政务网站和新媒体提供服务,付费用户数近4万,累计覆盖用户数超百万,今年成功入选国家新闻出版署主办的第三届中国报业深度融合发展创新案例(数字技术应用类)。接下来,南方新闻网还将进一步聚焦数字化生产和智能化把关及传播领域进行技术攻关,继续引入自然语言技术(NLP)和OCR识别技术在内容安全卫士等数字化产品中的应用,在中文文本检测能力基础上,提高图片视频的内容检测能力。(马菁璟 郑捷)

责任编辑: 小云

声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com

展开阅读全文

页面更新:2024-03-01

标签:语义   文本   自然语言   新闻网   句法   中文   句子   核心   错误   能力   国家   内容   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top