速途网7月30日消息(报道:吴佳馨)今日,今日头条宣布正式推出新版“灵犬反低俗助手”,支持对图片和文本进行识别。 这是时隔半年后,“灵犬”的又一次重要升级。
“灵犬”脱胎于今日头条反低俗模型,是一款检测内容健康度的辅助小工具,致力于打击低俗低质内容,净化网络空间。 用户目前可以在今日头条内,搜索“灵犬”进行试用。
从2018年3月28日上线至今,“灵犬”已经经历了三次迭代更新,每一次更新都在技术上有一个明显的跃升。今年2月上线的“灵犬2.0”,除了反色情低俗模型,加入反暴力谩骂和反标题党模型,覆盖了主要的低俗低质内容类型,整体识别准确率接近85%。截至2019年6月,灵犬反低俗助手的使用人次已经超过了300万。
此次公布的新版“灵犬”则重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别(反色情低俗、反血腥暴力)和文本识别(反色情低俗、反暴力谩骂、反标题党)。后续还将支持语音识别和视频识别。
字节跳动人工智能实验室总监王长虎介绍,在文本识别领域,新版“灵犬”同时应用了“Bert”和半监督技术,训练数据集包含920万个样本,准确率提升至91%。在图片识别领域,“灵犬”采用深度学习作为解决方案,在数据、模型、计算力等方面均做了针对性优化。
而对于同一现象在不同场景,会产生不同影响一事,王长虎说,针对低俗判断问题的复杂性和不同判断方式的局限性,一方面需要不断进化技术模型,一方面需要有效结合技术和人工判断两种方式。
当前,“灵犬”建设了比较完善的模型迭代系统。通过“数据收集—数据标注—数据清洗—模型训练—模型评估—badcase分析”这一套完整的流程,持续做优化。