前例のない「名刺データの活用」の先には、ワクワクする未来が待っている

2016年11月から活動をスタートした、研究開発部門「DSOC」。その組織の前身は、創業時から事業を支え続けている、名刺のデータ化を専門とする部門でした。真摯に名刺に向き合い、名刺を正確にデータ化してきたからこそ気づけた「新たな価値」は、Sansanが実現したい未来へとつながっています。
  • eight

「名刺データの入力」から「名刺データの活用」へ

D846bd9d8bed3525762c6026ffefbcb1f32de77b
▲2017年7月現在、DSOCには40名を超えるメンバーが在籍しています

Sansanでは、創業当時より名刺をデータ化する専門部門を設置しています。大量の名刺を正確かつ効率的にデータ化する独自のオペレーションシステムを開発・運営し、現在も事業成長の根幹としての役割を担い続けています。

同部門は、近年では世界に類を見ない名刺データベースと高度な専門技術やシステム運用の知見を有する組織へと成長しました。そこで、2016年11月に別組織だった研究開発部門であるR&D(Research and Development)部門などの人員を加え、その部門名をオペレーション部から「Data Strategy & Operation Center(DSOC:ディーソック)」に改めました。

この組織名称の変更に伴い、DSOCは「データの入力」と「データの活用」というふたつの役割を担うこととし、いままで以上に広い視野をもってテクノロジーの力で事業を牽引する組織として、その目的を改めて定義しました。2017年7月現在で40名を超えるメンバーが在籍しており、その組織規模は拡大し続けています。

DSOCの内部組織であるR&Dグループは、従前は名刺のデータ化における自動化のための技術を研究開発する組織でしたが、DSOCとなったことでその研究開発領域だけでなく、データ分析とその活用にもその領域を広げました。R&Dグループは、「研究そのものを目的とはせず、サービスを通じて世の中に価値を届ける」ことをミッションとしています。

なお、同グループは積極的に研究員を採用している最中で、多種多様なバックグラウンドや技術を有した研究員が多数在籍。そのうちの2名の研究員は、世界中のデータサイエンティストが参加するデータ解析コンペティションなどが催されているプラットフォーム「Kaggle」で最高位の称号である「Grandmaster」を所持しています。

それぞれの部門が担っていた役割を統合し、DSOCという新たな組織となった現在において、優れた研究者が新たなメンバーとして加わり続け、その規模を拡大し続けられている理由。それは、事業成長とともに増え続ける名刺枚数に対応しながらも、名刺のデータ化において高いセキュリティと精度を維持し続けてきたことにありました。

「動いて当たり前」。独自の名刺データ化システムの進化

B6135c674dacf7b8c7751fc1107edeea5767a753
▲10年以上をかけて進化し続ける、名刺データ化のフロー。名刺1枚当たり平均して約20の工程がある

Sansanが提供するサービスの起点となる、名刺データ化はテクノロジーの力だけでなく、そこに人力を組み合わせて行われています。しかし、創業から10年の間でテクノロジーがそのデータ化の中で担う役割は大きく変化してきました。

2007年の創業時、手で情報を入力するオペレーターへ効率的にタスクを配分するというデータ化における裏側の仕組みとなることや、その効率が落ちないようにゲーミフィケーションを取り入れるなど、当時のテクノロジーが担う役割は人力の有効活用を前提とした最適なフロー構築を支えることでした。

2010年ごろ、創業時から行ってきたテクノロジーと人力による名刺のデータ化に最初の大きな転換期が訪れます。事業成長に伴って増え続ける名刺枚数、そして季節要因である繁忙期と閑散期に取り込まれる名刺枚数の波(枚数差)、それらに社内で抱えるオペレーターの人数と従前の方法のままで対応することは、リソース的にもコスト的にも困難が生じていました。

そこでSansanは、名刺のデータ化だからこそ必要となる精度やセキュリティを保ちながらも「GEES(ギース)※」という独自の名刺データ化システムを構築します。その際に、テクノロジーの力を借りて導入に踏み切ったことのひとつが、社外のさまざまな人的リソースの活用——当時はまだ一般的ではなかった「クラウドソーシング」です。

一人当たりが取り扱うデータについて、それ自体が個人情報とならないレベルまで細分化(マイクロタスク化)することでセキュリティを保った上で、クラウドソーシング(マルチソーシング)で人的リソースを確保する、そして創業時から培ったノウハウで品質(精度)を保つ、このGEESの構築で問題は解消したかのように思えました。

しかし、法人向けサービス「Sansan」の利用社数は増え続けました。また、2012年には個人向けサービス「Eight」のスタートもあり、“事業成長=取り込み名刺枚数の増加”は止まることなく、むしろ日に日にそのスピードは加速していったのです。

そして、2013年ごろになると、名刺のデータ化に追われ続ける中で、ついに限界を感じはじめます。このままでは、近いうちに品質を保ったままデータ化できる名刺枚数の限界が訪れて、事業成長に対してブレーキをかけてしまうことになる——。

そこで、名刺データ化の自動化を目指し、独自技術の開発を行うための研究開発チーム「R&D部門(現在のR&Dグループ)」を創設しました。今までのように補助的な役割を果たすのではなく、画像解析技術や機械学習(AI技術)といった分野のテクノロジーを名刺データ化の主力として活用するためです。

また、ほぼ同時期に法人向けサービス「Sansan」と個人向けサービス「Eight」の名刺データ化システムを統合することを決定します。現在とは異なり、当時の「Sansan」と「Eight」は、異なるシステム(フロー)でデータ化を行なっていました。

「セキュアな方法で、正確に、早く、そして低コストで名刺をデータ化する」という、最終的に目指す方向は同じであっても、それぞれが異なるサービスのコンセプトをもっています。そのため、それぞれで求められるデータ化における品質の優先度も異なりました。

しかし、事業をよりスケールさせるために、双方のシステムの利点を掛け合わせてシステムの統合を実現する必要があったのです。このときに、その実現を目的として、DSOCの前身ともいえる部署「オペレーション部」を創設しました。

そのとき、すでに双方のサービスには、大勢のユーザーがいました。だからこそ、失敗は許されませんでした。

そこから数年にわたり、「サービスが稼働していて“当たり前”」、「変わらずデータ化の精度は担保しなければならない」というサービスとしての質を保ちながら、試行錯誤を重ね続けます。そして、2016年5月に「Sansan」と「Eight」の名刺データ化システムの統合が果たされました。それは、部門名がDSOCとなる約半年前のことです。

「動いていて“当たり前”」。それがいかに困難であっても、Sansanが提供するサービスは、交通機関や金融機関などのインフラサービスと同じような責任を有していると我々は考えています。

※ GEES:名称は、Global(より世界中のリソースを利用できる(日本語以外は地産地消で解決できる)、Elastic(繁忙/閑散期を柔軟に吸収できる伸縮自在な体制を組める)、Efficient(より効果的な方法で役割配置できる)、Scalable(よりスケーリングできる)、それぞれの単語の頭文字を取って付けられた。

正確性を追求していたからこそ踏み切れた「データの活用」

0852b438910deff2d8bf9bc999db9640f23e04e1
▲創業時から名刺のデータ化に注力してきた、DSOC・センター長の常樂諭

Sansanの創業以前にも、名刺をデータ化し管理するソフトウェアは存在していました。しかし、データ化技術の主流であるOCR(Optical Character Recognition=光学文字認識)だけでは読み取り精度が不十分であり、ユーザーがその都度データを修正する必要があったのです。

「名刺を正確にデータ化する」ということは、一般的な書類を電子化することとは異なり、従来の画像解析技術だけで行なっていては、必要な精度を実現できません。それは、他の書類などに比べ、名刺は非定型で、かつフォントやフォントサイズ、段組みなど、記載されるフォーマットが定まっていないためです。

名刺の情報は、1文字であっても間違いが存在すれば、データとしての価値は“ゼロ”になります。たとえば、Eメールアドレスのデータ化において、アルファベットの「l(エル)」と数字の「1(いち)」を間違ってしまえば、そのメールは届きません。

間違ってデータ化された情報は、何の利用価値もない単なる文字の羅列になってしまいます。サービスの利用者に紙の名刺を本当の意味でデータ化して活用してもらうためには、名刺に印刷された情報を間違いなく正確にデータ化することが必要です。

だからこそ、Sansanはコストをかけてでも精度を優先すべきであると判断。テクノロジーとオペレーターの人力を組み合わせ、創業時から一貫して高いセキュリティ環境と精度を保ちながら、名刺のデータ化を行なっています。法人向けサービス「Sansan」におけるデータ化システムの精度は99.9%を実現しています。

創業時から真摯に名刺に向き合い、約10年にわたって構築してきた名刺のデータベースは、テクノロジーと人力を組み合わせることによって実現された非常に高い精度のデータで構築されています。現在、そのデータベースはどこにも存在しないといえるほどにユニークなものとなりました。

また、独自の名刺データ化システム「GEES」を進化させながら、「Sansan」と「Eight」の名刺データ化システムの統合などを目指して行なった研究開発などにより、現在はOCRに依存しない独自のシステム構築を果たすなど、世界に類を見ない処理量と精度を実現するとともに、その中で独自の技術も開発してきました。

そして、データ化システムの統合を進める中で、自社の中に年間数億枚という枚数の名刺データ化を可能とする技術とノウハウがあること、そして構築してきた唯一無二の名刺データベースを分析し活用するための技術がすでに育っていたことに気づき、それを新しい可能性として見出しました。

正確性を追求し続け、事業成長とともに名刺のデータ化をひたすら行い続けたことが、「データの入力」という目的の先にあった「データの活用」という新たなチャレンジへとSansanを導いたのです。

DSOCが生み出す「新たな価値」の先にある未来

A5a23caa6bf9d9d31f253e89c9a2295800d003f9
▲名刺データを活用することで、企業が築き上げてきた数億もの出会い(つながり)を可視化できるようになります

2017年現在、DSOCは全世界で毎月数十万人のオペレーターとともに、日々名刺のデータ化に取り組んでいます。そして、名刺のデータ化において、将来的には限りなく人力の工程を減らし、完全自動化を果たすことを目指して研究開発を行っています。

また、Sansanの名刺データ化システム「GEES」は、プロダクトの海外展開に伴い対応言語の拡大を続け、事業のグローバル化にも貢献します。そして、新たにスタートした名刺データベースを分析し、その活用に注力していきます。その分析によって見えてくるのは、網羅されたビジネスにおける「人と人とのつながり」です。

たとえば、ひとつのソーシャルネットワークサービスで確認できる「人と人とのつながり」は限定的なものです。それは、双方がそのサービスを利用していることが、前提にあるためです。また、プライベートとビジネスで使い分けている人もいるかもしれません。

それに対して、名刺は誰もが利用しており、交換することはビジネスにおいて当たり前の習慣となっています。そのため、交換した名刺の情報や履歴をデータ化することで、自分のビジネスにおける「人と人とのつながり」が、網羅的にデータベース化されることになります。

そのデータベースは、ビジネスにおけるあらゆるコミュニケーションの土台となるインフラになりえるものです。それをDSOCが研究開発する技術によって分析すれば、会いたい人や将来会うべき人を予測すること、最適な人材と企業を結びつけることや予想を超えるアイデアを生み出す出会いをリコメンドできるようになるかもしれません。

そこには、働き方を革新するための無限の可能性が広がっています。

創業時から「名刺のデータ化」に奔走してきた、取締役・CISOでDSOCのセンター長を務める常樂諭は、目を細めて話します。

常樂 「部門名がDSOCとなり、優秀な研究員が集まってきてくれていることが、Sansanのデータベースがもつ魅力と価値を証明してくれていると思います。高い精度でデータ化し続けてきたことによって、ようやく気づけた名刺データベースの価値をこれからはサービスとして提供することができると考えています。
すでに分析による結果も徐々に出てきています。それを入力するオペレーション側のメンバーにも見せることで、オペレーションに従事するメンバーの視座がひとつ上がるという相乗効果も生まれています。
事業成長にブレーキをかけてしまうかもしれない要因という立場から脱して、これからはDSOCがデータドリブンでSansanの事業を牽引していきます」

「データの入力」、「データの活用」という、ふたつの役割を担いながら、DSOCは新たなメンバーを募り、引き続き規模を拡大していきます。そして、名刺データベースから「新たな価値」を生み出します。

DSOCの活動により生まれる「新たな価値」の先——そこは、Sansanが目指す未来へとつながっています。

---

▼Data Strategy & Operation Center(DSOC)ウェブサイト
https://jp.corp-sansan.com/dsoc/

関連ストーリー

注目ストーリー