中国「敏感詞」 そのチェックや解決方法
制作・開発■ 概要
先日、下記ブログで中国の「敏感詞」についてご紹介致しました。
今回は、「コンテンツ内に敏感詞が含まれているか」の確認方法とツールについてご説明致します。
■ 問題になる敏感詞の例
大きく分けると、手動確認とツール使用の2種類がございます。
①敏感詞リストを参照しながら手動確認
以下のような敏感詞例示サイトの記載を参考に、自社サイトのコンテンツを1ページずつ確認します。敏感詞はバリエーションが多岐にわたり、数も大量にあるため、単純に人的な工数が必要になり、確認漏れが発生しやすくなります。
ページ数が少ないサイトや、敏感詞確認の判断に慣れているネイティブが社内に在籍している場合は、手軽にチェックできる方法です。
②敏感詞チェックツール使用
サイトの規模が50ページを超えるようなもの、かつ確実にチェックしたい場合は、ツールを使用することをお勧めいたします。よく使われているツールを3つご紹介致します。
●5118
テキストチェックのみ対応が可能です。オンラインチェックもできますが、API連携によるチェックもできます。オンラインチェックもAPI連携も有料ですが、費用がお手頃です。
●百度智能曇(Baidu)
有料で、API連携によるチェックが可能です。チェック可能な形式:テキスト、画像、PDF、ビデオ等。Webサイトで利用される基本的なコンテンツ形式は網羅しています。
●網易易盾(ネットイース)
有料で、オンラインチェックとAPI連携によるチェックの両方に対応できています。チェック可能な形式:テキスト、画像、PDF、ビデオ等。Webサイトで利用される基本的なコンテンツ形式は網羅しています。検索結果のエクスポートも可能で、便利なツールです。
上記に紹介したツールは随時敏感詞リストを更新しています。自社のWebサイトが敏感詞の使用に際して、違反と認定されるような表現をしていないか、人的な工数を節約しながら、確実性の高いチェックが可能になります。コストは必要になりますが、ツールを利用して法令対応に対応することは長期的な視点からメリットがあり、お薦めいたします。
敏感詞チェックやツールについて、疑問がある場合、弊社までご連絡ください。