「データのパーティション」には多くの種類とそれぞれに特性があります。本稿では適切なパーティションを選択するために、各パーティションの手法ごとに利用シーンやメリット・デメリットを考察します。
モデリングを行う際に結果に大きく影響を与えるのが「データのパーティション」です。パーティションは特徴量エンジニアリングなどと異なり、表面上に見えにくいため軽視されがちですが、適切なパーティションを選ばないことにより運用で痛手を負うケースがあります。
オフセット項を利用することによって、ビジネスロジックや既存のドメイン知識をそのままモデルに組み込むことができます。少し高度なテクニックですが、オフセット項を身につけるとより機械学習の幅が広がります。
機械学習モデルをビジネスで活用するには、なぜその予測がなされたか等、高い解釈性・説明性が求めらます。本ブログでは最近のアップデートで可能になったShapley Valuesを応用したSHAPによる特徴量の影響度算出について解説します。
今『データドリブン』『データドリブン企業』がバズワードになっていますが、品質管理分野では既にデータドリブンという経営戦略が存在していました。では、データドリブンの本質は以前から変容したのか?データドリブン企業はAIを導入し成功するのに有利なのか?本ブログではこれらのテーマを考察します。
金融機関での不正出金のニュースが世を賑わしています。ほぼ毎日なんらかの不正が行われています。その被害額も凄まじく、2019年1年間のクレジットカードの不正利用額は273.8億円にも上ります。本ブログでは、様々な不正の種類に触れながら、実際に不正を防ぐための対策をどのようにAIで実現していくか紹介します。
AI(人工知能)技術が注目をあつめる昨今、ディープラーニング(深層学習)という単語を耳にする機会も増えてきました。一方で、従来の機械学習との違いや詳細な仕組みはわからないという方も多いのではないでしょうか。 そこで本稿ではディープラーニングとAI、マシンラーニングとの違い、kaggleコンペ優勝者が使ったモデルかつ産業応用事例に基づいて、どちらの領域でディープラーニングが優れているか、優れてないかを紹介します。
製造業やユーティリティー業界では、従来から製造設備やインフラ設備で多くのセンサが用いられてきました。近年ではビッグデータやIoTの機運の高まりから、センサの計測波形を蓄積して機械学習で活用する動きも活発になっています。本稿ではセンサの計測波形を機械学習に使用するためのプロセスについてご説明します。
医療業界でのAI活用はフィージビリティスタディのフェーズから脱しつつあり、予防医療・先制医療に繋がる臨床研究や医師の診断補助、病院オペレーション改善などのケースで成功事例が報告されるようになってきました。本稿ではDataRobotユーザー様のお取り組みを中心に、機械学習が医療業界の様々な課題解決に役立っている実例をご紹介します。