予測 AI
モデリングを数時間ではなく数分で開始 データ準備の手間を省きます。データをクリーニングしてバランスを調整し、データのコンプライアンスを確保しながら、特徴量エンジニアリングとモデリングの準備を整えます。
欠損値を削除せずに解析とモデリングを開始します。
反復可能なレシピで重複を排除し、繰り返しのコーディングを不要にします。
合成データ生成を使用して、データセットのオーバーサンプリングとアンダーサンプリングを検出して修正します。
すべてのデータに接続 接続や認証による速度低下なしにデータの操作を開始できます。最先端のデータウェアハウスを備えたコネクターを使用して、すべてのデータを 1 つのワークスペースにシームレスに統合します。
繰り返しのコーディングなしで特徴量を定義 データセットのすべての特徴量を自動的に定義することで、特徴量探索を効率化します。特徴量探索と削減アルゴリズムをカスタマイズして実行し、重要度によって特徴量を定義してランク付けし、無関係なものをすべて削除します。時系列プロジェクトに対してさまざまなラグ構造、データ集約、差分化戦略をすばやく実験します。
最も関連性の高い特徴量をすぐに使用
マルチモーダルデータの準備から複雑さを排除 Eカスタマイズ可能な特徴量エンジニアリングパイプラインにより、多様なデータ形式を簡単にオーグメンテーションできます。特徴量を変換し、提案される数十の前処理と特徴量エンジニアリングのアプローチをすばやく実験します。
データセットを時間で分割したり、タイムゾーンとタイムスタンプを同期させたり、ログ変換を適用してデータセットを定常化したりできます。
座標や衛星画像をカテゴリーデータやベクトルなどの実用的な特徴量に変換します
さまざまなタイプのニューラルネットワークを使用して、画像をカテゴリーデータまたはベクトルに処理します。
エンコード技術を使用して、未加工データにラベルを付けて分類します。
マルチモーダルデータの前処理を簡素化 複雑な 機械学習のユースケースでさまざまなタイプのデータを処理する際の複雑さを解消します。データの前処理の最適な方法を選択して実行し、モデリングパイプラインとレシピをカスタマイズします。
何百ものラグ、差分化オプション、データセットのオーグメンテーションを効率的に探索して、モデルの精度を最も向上させるアプローチを見つけます。
合成データの生成により、限られた GIS データを強化します。特徴量を定義してデータ型を変換するための最適な前処理方法を探索します。
ベクトル化と編集可能な特徴量エンジニアリングのブループリントを使用して、画像データ処理を最適化します。画像変換パイプラインを使用して、限られたデータセットを拡張します。
合成データの生成を使用して、オーバーサンプリングデータとアンダーサンプリングデータのバイアスをなくすことで、データを有用なカテゴリーに最適に変換します。エンコード方法と、最も関連性の高い特徴量を選択します。
特徴量エンジニアリングパイプラインの自動化 E自動化された特徴量探索と削減の方法により、効率的に実験します。ユースケースに合わせてカスタマイズし、インパクトの少ないオプションを整理しながら、すべての特徴量をランク付けします。
DataRobot で未加工データセットの既存の特徴量を定義することで、特徴量エンジニアリングをすばやく開始します。
プロジェクトのニーズに基づいてカスタマイズされた特徴量が提案されるため、時間を節約できます。また、要件をカスタマイズして、無関係な特徴量とノイズを除去します。
自動化された特徴量エンジニアリングにより、関連する特徴量をすばやく特定します。
大規模で柔軟なモデルチューニング 何百ものモデルとバリエーションを探索してテストし、ユースケースに対して最も正確なものを見つけます。1 対 1 の実験比較を使用してモデルを細かくチューニングし、トレーニングします。
実験、ノートブック、データを一元化 自動的なバージョン管理により、複数の実験を簡単に管理および追跡できます。プロジェクトデータ、特徴量エンジニアリングのブループリント、実験、ノートブックにロールベースでアクセスできる統合ワークスペースで、シームレスにコラボレーションできます。
時系列モデリング すぐに使える時系列の手法の提案をカスタマイズし、時系列モデリングアプローチを習得する複雑さを伴わずに、高品質できめ細かい予測を生成します。
動的時間伸縮法(DTW)などのさまざまなアプローチを使用して、ビジネスロジックだけでなく、類似の系列で時間ベースのパターンを見つけます。
さまざまな手法を使用して、類似の系列から学習し、限られたデータで予測できるようにします。データを自動的に集約するか、行ベースの時系列を使用して、不規則なデータを処理します。
予測期間を簡単にカスタマイズして、現在の値と可能性のある未知の値を予測し、一連の時系列モデルと手法を使用して、現在と過去の値を適切に処理します。
異常なデータパターンを検出し、それらを引き起こしている特徴量を個別および全体的な観点から理解します。合成 AUC を使用して、さまざまな教師なしアプローチの精度を測定します。
マルチモーダルモデル時間認識データ、画像、地理空間座標、自然言語など、さまざまなデータ型を組み合わせて教師ありモデルと教師なしモデルを構築することで、精度を向上させます。
教師ありモデル データを迅速かつ反復可能な方法で予測モデルに変換
データを大規模にタグ付けして分類することで、インベントリーに関するインサイトの獲得、プログラムによるリードのスコアリング、スパムの検出などを行います。
予測モデルを構築し、特徴点間の関係性を理解することで、ビジネス運用を予測して最適化します。
複数のデータポイントにラベルを割り当て、インデックス可能なインベントリーの作成、顧客フィードバックの大規模な分析、顧客への提案のパーソナライズなどのユースケースをプログラムで構築します。
相互に排他的なカテゴリーのどれにデータが属するかを予測し、画像認識、ドキュメント分類などのアプリケーションを可能にします。
教師なしモデル 大量のデータから潜在的な特徴量やパターンを見つけ出し、専門的なユースケースを提供します。
未加工の非構造化データのパターンと類似点を見つけて、レコメンデーションエンジンや顧客ライフサイクルスコアリングなどのユースケースを構築します。
データ内の外れ値を検出して、不正行為、製造エラー、セキュリティ侵害などのまれなイベントを予測できるようにモデルを強化します。
ワンクリックでのデプロイ AI パイプラインを即座に生成して、完全性を損なうことなく登録済みモデルを構築して本番環境にデプロイします。
AI をビジネスに組み込み、データに基づいた意思決定を実現 モデルをダウンストリームのビジネスアプリケーションに統合したり、使いやすいアプリケーションにデプロイしたりすることで、モデルのインパクトを最大限に高めます。
共有可能でインタラクティブなアプリケーションをわずか数行のコードで作成し、ビジネスユーザーがデータに基づいて意思決定できるように支援します。
オープン API を使用して、予測を社内のシステムやアプリケーションに統合します。また、監視ツールを使用して、モデルの正常性と予測の遅延を追跡します。
GUI アプリビルダーを使用して、予測アプリを作成してカスタマイズしたり、既存のテンプレートを使用して「what-if」分析などを予測したりできます。
カスタム指標の監視 チームのニーズに基づいて、本番環境の各モデルの正常性を追跡します。データドリフト、遅延、サービスの低下に関する自動アラートを受信します。
ビジネスに不可欠な指標を監視
レガシーモデルをシームレスに置き換え 古いモデルを再トレーニングするのではなく、最新モデルの実装に重点を置きます。実験モデルと本番データにデプロイされたモデルを比較し、簡単にホットスワップすることで、ダウンタイムなしで予測精度を維持または改善します。
本番データで最高レベルのパフォーマンスを発揮するモデルでテストしてホットスワップ
モデルの説明可能性と品質を可視化 特徴量のインパクト、効果、係数などをインタラクティブに可視化し、モデルのあらゆる側面を探索します。
シャープレイ値、LIME、バイオリンプロット、特徴量のインパクトを可視化し、どの特徴量がモデルの決定に影響しているかを理解します。
年齢、人種、性別などの変数に基づいて予測を生成し、結果をセグメント化することで、潜在的なバイアスを検出します。
各コンポーネントが最終的な予測にどのように寄与するかを可視化することで、モデルを完全に説明できるようにします。
非線形の関係性を明らかにし、インパクトはあるが関連性の低い特徴量を特定して、潜在的なエラーを見つけ出すことで、モデルを改善します。
モデルの方法論についての関係者の認識を一致させる 明確で平易な言葉でドキュメントやプレゼンテーションを自動的に生成することで、複雑な数学的概念をビジネスやコンプライアンスの関係者にわかりやすく説明するという課題を解決します。
コンプライアンスと透明性に必要なドキュメントを自動的に生成
カスタムモデルと外部モデルの登録 DataRobot や外部のモデルなど、組織のモデルを 1 つのリポジトリーに統合します。バージョン管理を徹底し、コラボレーションを強化します。
すべての組織モデルを 1 つのリポジトリーで追跡Edit Translation