データの偏差を手掛かりに不正行為を予測する  

異なる複数の予測モデルを作成して評価し、予測モデルの精度に対するサンプリング手法の影響を確認する

Last updated | By Sharath Kumar RK, Manjula G Hosurmath, Vishal Chahal

Description

予測アナリティクスでは履歴データを使用して将来のイベントを予測します。通常は履歴データを使用して、重要な傾向を捕捉することを目的とした数学的モデルを作成します。作成した予測モデルを現在のデータに対して使用して、次に何が起こるのかを予測したり、最適な結果を得るために取るべきアクションを提案したりします。このコード・パターンでは、これと同じ手法に従って、クレジット・カード詐欺を検出するためのソリューションを作成します。予測モデルを使用すれば、不正行為の可能性があるアクティビティーを自動的に特定して優先順位を付けることができます。これにより、詐欺に対処する部署は、調査が必要になりそうなインシデントだけを調査できるようになります。このコード・パターンで、異なる複数のサンプリング手法によってデータの偏りに対処し、各種の統計アルゴリズムを使用して正確な予測を生成する方法を学んでください。

Overview

クレジット・カード詐欺の件数は世界中で増加の一途を辿っています。その被害額は、毎年 10 億ドル単位で増加しているほどです。クレジット・カード詐欺とは、取引の際にクレジット・カードやデビット・カードなどの決済カードを不正な資金源として使用するなど、決済カードが関連する窃盗や不正行為を表す広義の言葉です。ACI Worldwide および金融業界のコンサルティング会社である Aite Group が公開した 2016 年のデータによると、過去 5 年の間に、世界中でほぼ 3 人に 1 人の消費者がカード詐欺の被害に遭っています。ベンチマーク調査の結果でも、17 か国のうち 14 か国での調査で、2014 年から 2016 年までの間にカード詐欺の件数が増加していることが明らかになったと報告しています。2016 年の iovation/Aite Group の調査による金融詐欺に関するレポートには、クレジット・カード詐欺による損失は、2020 年までに米国だけでも 100 億ドルに上ることになるという予測が反映されています。このような状況の中、この驚くほどの数値を減らすためにテクノロジーを駆使することが必要不可欠となっています。

不正な取引は被害額が大きいとは言え、あらゆる取引を調査して不正を見つけるのではあまりにも費用がかかり、非効率的です。あらゆる取引を調査できるとしても、調査対象の消費者が無実であれば、カスタマー・エクスペリエンスが損なわれることになり、顧客を失いかねません、予測モデルを使用すれば、詐欺行為の可能性があるアクティビティーを自動的に特定して優先順位を付けることができます。他の有効なソリューションと比べ、人間による誤りのない、効率的かつ正確なソリューションとなります。このソリューションで目標となるのは、不正と予測されたものの、実際には不正ではないインスタンス (誤検出) と、不正であっても予測されなかったインスタンス (検出漏れ) を最小限に減らすことです。

このコード・パターンをひととおり完了すると、以下の方法がわかるようになります。

  • バギングとブースティングという統計手法のそれぞれを使用して予測モデルを作成する
  • 異なる統計モデルを実行して、それぞれの結果を評価する
  • 多数集団と少数集団との間のバランスがとれるようにデータをサンプリングし、データの偏りに対処する
  • サンプリング手法によって予測モデルの精度が向上する仕組みを実証する

Flow

  1. Watson Studio にログインして、オブジェクト・ストレージを組み込んだインスタンスを作成します。
  2. CSV ファイルをオブジェクト・ストレージにアップロードします。
  3. URL から Jupyter Notebook をインポートします。
  4. ノートブック内で予測モデルとサンプリング手法を実行します。
  5. 予測モデルの結果をオブジェクト・ストレージにエクスポートします。

Instructions

詳細な手順については、README を参照してください。手順の概要は以下のとおりです。

  1. IBM Cloud でアカウントを作成します。
  2. 新しい Watson Studio プロジェクトを作成します。
  3. ノートブックを作成します。
  4. データを追加します。
  5. データフレームを挿入します。
  6. ノートブックを実行します。
  7. 結果を分析します。

Related Blogs

Call for Code 準優勝者: AI を使用して改造の可能性を判断する PD3R

ネパールでエンジニアとして働く Nirmal Adhikari は、地震がもたらす惨状をじかに目にしました。彼はまた、被害状況を評価したくても、なかなかコミュニティーにアクセスできないフラストレーションも実感しました。 「バスや交通機関で現地に辿り着くことはできませんでした。アクセスが禁止されていたためです。大勢のエンジニアを配置しなければならなかったのですが、それには相当な時間がかかりました」。2015 年のネパール大地震を振り返り、Adhikari はこのように言いました。「このことが理由で、私たちは多くの人手を要することなく迅速に作業を行えるよう、何か対策を取らなければならないと思ったのです」。 Adhikari と、Build Change で働く彼の同僚たち (Lakshyana K.C.、Nicolas Ortiz、Shreyasha Paudel、Kshitiz Rimal) は、人工知能によって検査を自動化し、地震で住む場所を追われた人々がすぐに自宅に戻れるようにできないかと考えました。 彼らがチームとして作り上げたのが、この Post-Disaster Rapid Response Retrofit (PD3R) です。3D モデル画像で学習した AI に基づくこのソリューションによって、自然災害後に住居を追われた家族がすぐに構造工学上のアドバイスを受けられるようになる可能性があります。PD3R は 2018 Call for Code Global Challenge で準優勝作品として選ばれ、25,000 米ドルの賞金と The Linux Foundation による長期のオープンソース・サポートを獲得しました。 「地震が発生すると、住居が全壊するか、部分的に損傷を受ける可能性があります」と、Ortiz は言います。「PD3R で目的としているのは、再建または補強することが可能な住居を、人工知能を使用して短時間で評価することです」。 Call for Code Global Award 祝賀会の録画を見る チームは Watson Studio を使用して、2,000 点を超える画像をベースにカスタムの視覚認識モデルを作成しました。IBM Watson...

続けて読む Call for Code 準優勝者: AI を使用して改造の可能性を判断する PD3R

Call for Code 優勝者: モバイル・ホットスポットとダッシュボードによって災害発生後のコミュニティーを支援

昨年メキシコ・シティーでマグニチュード 7.1 の地震が発生したとき、Subalekha Udayasakar はインターネットへの接続を失うと、いかに無力であるかを実感し、その混沌を目の当たりにしました。 「大勢の人々がインターネットに接続できなかったため、救助の手を差し伸べることができなかったのです」と、彼女は言います。「それに、被害に遭った人たちが実際にどのような状況に置かれているかについても、まったく見当がつきませんでした」。 この体験を機に、Subalekha と彼女のチームメイト (Jonah Model、Katie Mathews、Gandharv Patil、Matthew Malin) は災害への対応と復旧の最中に市民と救助隊がオンラインでつながり続ける方法を生み出しました。 ハードウェアとソフトウェアで編成された、この Project Lantern というソリューションは、2018 Call for Code Global Challenge で最優秀作品に選ばれました。Project Lantern が依存するのは、低価格のハードウェアとソーシャル・データ、そして入手した情報と状況の変化を反映したリアルタイムのデータです。 災害復旧時にオフラインになったワイヤレス・ネットワークで、鍵ほどの大きさの Lantern というデバイスがポップアップ通信ハブの役割を果たします。この Lantern デバイスでは、カスタマイズ可能な Web アプリを使用してニュースを受信し、救助とボランティアを要請するとともに、地図ツールによってユーザーを避難所と飲料水や燃料を入手できる場所まで誘導します。このように、Lantern は極めて急を要する状況でコミュニティーの秩序を維持するよう設計されています。 Call for Code チャレンジに向けて、チームは IBM Watson を利用してオフラインで収集されたデータを解釈し、その結果を救助隊用のダッシュボードとして提示することにしました。現地のボランティア、危険にさらされている人々、訓練された難民救済ワーカーの間のコラボレーションは、IRIS (Intelligent Routing and Insights の略語) によって支援します。 「IRIS の役目は、災害時のあらゆるデータに加え、IBM Watson の機械学習機能、The Weather Channel からのデータ、そして公開されているその他すべての API...

続けて読む Call for Code 優勝者: モバイル・ホットスポットとダッシュボードによって災害発生後のコミュニティーを支援

Call for Code 優勝者: 緊急支援ネットワークで中断のない銀行サービスを実現

史上最大の地震の 1 つとして数えられる 2008 年の四川大地震が発生したとき、中国農業銀行 (ABC) は被災者たちに緊急支援と金融サービスを提供しようと試みました。 けれども、銀行カードや写真付き ID を失くすなどといった、いくつかの泣き所が災害によって生み出され、同行は思うように顧客にサービスを提供できませんでした。 「この 10 年の間、世界中で多くの自然災害が発生しています」。ABC 研究開発センターで副総支配人を務める Wang Yi の言葉です。「私たちは被災者への金融サービスを改善することを目指しています」。 こうしたサービスの改善を目的に、ABC の開発者たちは Call for Code の呼びかけに応じ、United Aid Net (UAN) を作成しました。UAN は、自然災害の発生時も復旧時も中断することなく金融サービスを提供するためのグローバル緊急支援ネットワークです。顔認識に基づく預金引き出しとブロックチェーンを基に構築されている UAN は、災害時に家族や友人との間で一時的に金融サービスを共有することを可能にします。 仕組み このソリューションを開発したのは、北京を拠点とするチーム Green Coder です。Dong Xiaojie、Liu Xu、Liu Bo、Huang Zhiming、Liu Jiajie からなるチームが開発したこのソリューションは、2018 Call for Code Global Challenge で最優秀作品に選ばれました。 「UAN は、金融機関ネットワークと家族ネットワークという 2 つのネットワークで構成されています」。ABC でアプリケーション・プラットフォーム開発ネットワークの副総支配人を担当する Xiaojie は、このように言っています。「現在、私は UAN...

続けて読む Call for Code 優勝者: 緊急支援ネットワークで中断のない銀行サービスを実現

Related Links

Data science

知識と洞察を抽出するために、構造化データと非構造化データを分析するシステムと科学的手法。

Analytics

データを解析し、情報を得るためのパターンを見つける。

Python

Python is a programming language that lets you work quickly and integrate systems more effectively.