2022-08-28

【清水康裕・ダブルスタンダード社長】ビッグデータ時代に求められるデータクレンジング技術とは?

常識と非常識(ダブルスタンダード)から世に有益な新しい常識を創る――。これが当社の社名に込めた思いです。

【企業のDXを支援】デジタルホールディングス・野内敦社長「企業をデジタルシフトに導く」

 2012年頃から「ビッグデータ」という言葉が登場し、今ではビッグデータを活用して自社のビジネスを拡大しようとする企業が多くなっています。しかし、実際にはビッグデータの導出の基本となるデータを活かしきれていないケースが多く、生産性向上にもつなげられていない事例が散見されています。

 実は企業が抱えるビッグデータを巡っては、データを解析する人材を抱えていても、データの精度があまりにも低いために効果的な利用ができていないのです。そこで当社は情報を自動的に収集・整理し、自動でバラツキのあるデータをクレンジング(不要データのを除去してキレイにすること)して補正・修正処理を施した上で高精度なデータに仕上げて提供しています。この作業を当社が肩代わりすることで、顧客企業は分析に専念することができます。

 データを分析する領域には様々な企業が参入していますが、データクレンジングのような領域は非常にニッチ。しかしながら逆に言えば、そこはブルーオーシャン市場です。さらにデータクレンジングには「汎用性」と「自動化」がポイントになるのですが、これらのノウハウや知見は一朝一夕ではできません。

 汎用性とは領域や業界に縛られず、あらゆるデータを汎用的にキレイにすることです。また、自動化はデータクレンジング工程を自動で行うことです。

 複雑な文字列の表記からデータ化に必要な情報だけを取り出し、さらには不足情報を自動で補正しながら、無数の表記パターンの中から正確な表記へ自動修正する。当社はこの技術を独自に開発し、ノウハウを蓄積してきました。ライバル社は現時点の当社に追いつくだけでも相当な時間がかかるでしょう。

 なぜなら、データにはそれぞれクセがあり、このクセを見極めて標準化するためには、たくさんのデータに触れる機会が必要になるからです。どんなに優秀なエンジニアやデータサイエンティストでも簡単にはできません。しかし当社は約10年にわたって、データクレンジング領域に特化してきたため、データをキレイにするための共通基盤を早期に構築しています。

 当社の場合、不動産や金融、証券といった業種の取引先が多いのですが、例えば、不動産の事例を挙げれば、ある会社のホームページの変更情報をいち早く検知し、それを正確に自社の顧客企業のホームページでも情報を展開するための仕組みがあります。

 通常、これらの作業は人の手でホームページをチェックして変更箇所を探していました。ところが当社のサービスを活用すれば、この手作業から解放される上に、大幅な人件費の削減が可能になります。人は人にしかできない付加価値の高い領域に集中することができるのです。

 金融では、銀行口座を開設する際、個人情報を記入しますが、記入する人はもちろん、銀行も情報をシステムに入力しなければなりません。しかし、当社のサービスでは運転免許証をスマートフォンなどで撮影し、Web上で提出してもらえば、AI搭載のOCR(光学文字認識技術)が名前や住所などをデータ化するため、情報入力の作業がなくなります。

 デジタル化はますます広がっていきます。その中で常識に捉われていては手遅れになってしまう。データの世界でも同じです。そうならないためにもお客様に対して非常識でも新たな価値を提供していく。それが当社の使命であると考えています。

Pick up注目の記事

Related関連記事

Ranking人気記事