自治体様の文字同定作業は
AIを使った画像認識技術で
スマートに解決!
- 地方自治情報化推進フェア2022に出展しました
- 月刊J-LIS 2022年11月号に広告掲載しました
- 外字と文字情報基盤文字(IPAmj明朝)とのマッチング【導入実績】300自治体以上(パートナー提携実績含む)
システムの文字環境変更時に必要となる、文字同定作業において、多数の実績を持つ完全自社開発の文字同定AI(特許取得済み)が貴庁をご支援いたします。
同定支援ツール【1.0版】からダウンロードした同定結果の確認を
効率化する補助ツールを無償でリリースします!
文字同定とは
ある文字が特定の文字集合の中に含まれているかどうかを調べ、含まれていれば該当の文字と紐づける作業です。情報システムの更新や、情報システム間の情報連携を行う際に、各情報システムでそれぞれ異なる文字集合を使用している場合に必要となります。
本サービスでは、令和5年度まで自治体様向けに外字と文字情報基盤文字(IPAmj明朝)とのマッチングに関するサービスを提供しておりました。令和6年度以降提供予定のサービスについては準備中です(現在提供準備中のサービスについてはこちら)。その他のご要望については先ずはお問い合わせください。
お知らせ
2024/04/05 | 同定支援ツール【1.0版】からダウンロードした同定結果の確認を効率化する補助ツールを無償でリリースします! |
2022/11/30 | 地方自治情報化推進フェア2022に出展しました。 |
弊社は文字のAIマッチングについて特許を取得しております
<特許の概要>
- 発明の名称:文字判定装置及び文字判定プログラム
- 特許番号:第7410532号
- 登録日:令和5年12月26日
- 特許権者:株式会社佐賀電算センター
特長・メリット
1
AIによる画像マッチング
弊社で作成した文字同定 AIを用いて、自治体様でお使いの外字と行政事務標準文字(MJ+)との画像マッチングを行います。
画像マッチングにより、外字情報と行政事務標準文字(MJ+)とを「目(AI)」で比較した場合の類似性を「見える化」します。
2
処理時間の短縮・信頼性
従来型の作業で候補リストの作成に要していた時間(1ヶ月程度)を数分で完了することが出来ます。また、ドットで作成されたフォントでも、AIにより処理が可能です。
3
職員様同定作業の効率化
同定対象の外字が IPAmj 明朝に存在する場合、AI が候補として抽出する確率は100%です。(※)
また、マッチング率が高い順番に同定候補文字が表示されますので、目で確認する文字数を最小限に留めます。
※2021~2022年に実施した外字と文字情報基盤文字(IPAmj明朝)とのマッチングに関する検証における確率です。
抽出結果確認ツールイメージ(予定)
01
使いやすいExcelツールとしてご提供いたします。
Excelで動作するツールとして提供いたします。操作に迷うことなくご利用頂けます。
*2007以降で動作確認済み
*操作マニュアル(電子データ)についてもご案内いたします。
*ツールを利用するパソコンに、行政事務標準文字を表示するためのフォント(IPAmj明朝 及び 追加文字行政事務標準明朝フォント )をインストール下さい。
02
外字文字総数や類似度ごとの総括表がご確認いただけます。
確認処理の前段階で、外字フォントに含まれる行政事務標準文字(MJ+)総数や行政事務標準文字(MJ+)とのマッチング具合が確認できます。貴庁の外字が行政事務標準文字(MJ+)の中に、どの程度含まれているかの目安として、ご確認頂けます。
03
拡大しながら効率的に確認が可能です。
左側『外字』列に貴庁外字のコード情報・字形、右側『同定結果』列に行政事務標準文字(MJ+)の候補毎のコード情報・字形・AIが判断した類似度を表示しています。候補は左からマッチング率が高い順に5文字表示しております。
04
簡単な操作で確定処理からの変換テーブル出力が出来ます。
マウス操作(左クリック)で候補文字を選択することが出来ます(緑色表示)。 検討が必要な事項があれば、特記事項・コメント等をご活用下さい。 もし候補文字が存在しない場合、個別指定の欄にコード情報をコピー頂くと、字形の表示が可能です。 右クリックで確定処理(黄色表示)を行うと、確定した候補の漢字水準の確認も可能です。最終的には変換テーブルを出力頂けます。
サービスメニュー(準備中)
「文字数が増えると費用が高くなる」と言った従来型サービスとは一線を画し、文字数が多くても「費用の抑制」・「正確性の向上」・「負担軽減」これらを提供出来るような、サービスメニューをご準備しております。費用については個別にご相談ください。
※サービス内容については、令和5年度までに提供していたサービスについて記載しております。 (外字と文字情報基盤文字(IPAmj明朝)とのマッチング)
※令和6年度より、本サービスについては変更を予定しております(現在提供準備中のサービスについてはこちら)。
基本サービス 「AI外字同定候補抽出」
外字ファイルをお預かりした上で、AIでの処理結果を、変換テーブルが作成可能なツールに取込み、お渡しいたします。
【留意点】
- 外字ファイルについてはEUDC.TTEを想定しております。その他の形式についてはご相談ください。
- 漢字を対象としております。
- 変体仮名についても処理は可能でございますが、漢字よりも精度が下がります。
オプションサービス
住基ネット統一文字フィルタリング
貴庁保有の住基ネット統一文字と外字の変換テーブル(※1)を提供頂ければ、AI外字同定候補抽出結果に重ね合わせ、自動確定処理をいたします。
確認作業の負担軽減・住基ネット統一文字と紐づくIPAmj明朝の字形の見直しが可能です。
AI内字同定候補抽出
内字フォント(※2)について、AIでの処理結果を、変換テーブルが作成可能なツールに取込み、お渡しいたします。
【留意点】
-
利用している内字のフォントファイルをご提供いただくことを想定しております。未検証フォントもありますのでご相談下さい。
-
対応範囲は以下のとおりです。
JIS第1~4水準漢字(サロゲート文字を含む)
JIS補助漢字
Windows特殊文字
ホスト拡張漢字
同定支援(候補選択)
弊社のJIS規格の包摂規準をベースとして、同定作業を実施し、あらかじめ候補が選択された状態で処理結果をお渡しいたします
【留意点】
-
最終的な確認・承認は貴庁にて実施頂く必要がございます。なお、基準に該当しない文字のマッピングについてはご検討いただく必要がございます。
-
『住基ネット統一文字フィルタリング』との併用が前提となります(※3)
※1:貴庁内字が住基ネット統一文字と互換性がある場合は、変換テーブル自体が存在しない場合もございます。
※2:内字については最新バージョンのみの処理を予定しております。
※3:貴庁内字が住基ネット統一文字と互換性があり、変換テーブル自体が存在しない場合を除く。
納品物(全てのサービス)
- 文字同定支援ツール
- 文字同定支援ツールマニュアル
※電子データもしくはCD-R(電子データのみを格納)での納品を想定しております。
AIでの処理について
ドットパターンで比較する様な処理とは異なり、文字を形として認識する独自処理を採用しております。
その結果が、マッチング率=類似性のある優先度(類似度)として表示されております。このマッチング率については、『独自の特徴ベクトル化』により、字形をベクトル変換し算出しております。
つまり、人が目で見る様に、文字を形として捉えた上で、人間が数値化出来ない、類似性を見える化しています。
参考)マッチング率の“精度”を検証
※複数自治体で検証済み
・第5候補までで同定できる確率:100%
・うち、第1候補で同定できる確率:92%以上
・うち、第1候補又は第2候補で同定できる確率:98%以上
※2021~2022年に実施した外字と文字情報基盤文字(IPAmj明朝)とのマッチングに関する検証です。
※検証データにおける確率です。
※同定対象の外字が IPAmj 明朝に存在する場合の確立です。
ほとんどがマッチング率の高い第1候補・もしくは第2候補で同定可能!
事例紹介
よくあるご質問
外字フォントについてはどのように提供すればよいでしょうか?
受け渡し方法や媒体についてはメールや郵送を想定しておりますが、ご心配の点などございましたら、弊社にご相談ください。
個人情報について、外字フォントには含まれておりませんのでご安心ください。 流出事故等の個人情報流出の心配は不要です。
打合せ等は想定していますか?
基本サービス・オプションサービスでは、打合せ等は想定しておりません。打合せ等で職員様の手をわずらわせることなく、いただいたデータをもとに処理結果をお返しすることができます。
処理結果の納品までどのくらい時間がかかりますか?
基本サービスの範疇では概ね5営業日程度を想定しております。オプションサービス『同定支援作業(候補選択)』をご依頼の場合は、概ね2週間程度を想定しております。ただし、依頼が輻輳する時期については、ご依頼時に納品時期を、調整させて頂く場合がございます(納品希望日から遡り※営業日前までに依頼が必要など)。
依頼団体が増えるにつれて、AIはどんどん学習していくのですか?
AIはリリース時に大量の教師データで学習しておりますので、依頼ごとに学習する必要はなく、現段階で高いパフォーマンスを発揮することができます。
外字が増えた場合は複数回処理してもらえますか?
基本的に1回処理のみを想定しておりますので、複数回の処理は想定しておりません。処理依頼以降、外字が増えた場合は、貴庁にてご検討頂く必要がございます。(変換テーブルへの追加方法等の手順はマニュアルにてご案内いたします。)