2013年3月16日土曜日

整理ツールなどのツールを一致


データ管理の展開の話題が議論されるとき、しばしば発生する問題の一つは、一致ツールとどのようにそれはマスターインデックスデータベースにこれを持っレガシー大容量のデータを蓄積する助けることができることの重要性である。これは、できるだけ迅速に行う必要があります。この手順についてのもう一つのことは、それがマスター·インデックス·データベースは、データをクレンジングし、エラーを削減し、データの重複を減らすことができるべきであるということです。

そこから選択するさまざまなマッチツールプログラムはありますが、彼らの主な目的は、あなたが一致ロジックを分析することができ、レガシーデータと一致している、およびマスターインデックスアプリケーションに大量のデータをロードすることです。この方式のツールを使用して、ファイルを簡単に整理するためのプロセスになります。あなたはスケーラブルであり、あなたが探している解決策を提供しますマッチ機器·ツールを持っているプログラムのために行くことができます。彼らは、これは彼らに最高のパフォーマンスを与えると信じているから他の人が複数のプロセッサに電源を入れます。

さらに詳しく説明するには、matchツールはマスター·インデックス·アプリケーションから生成され、2つの重要な部分で構成されています - バルクローダーとバルクのMatcher。 Bulk Loaderでは、バルクのMatcherがマスターランキングマッチエンジンを使用して確率的マッチングアルゴリズムに回して、入力データ内のレコードを比較し、一方のマスターインデックスデータベースに直接データをロードするためにバルクMatcherの出力を使用します。これは、データが付属しているすべてのレコードを一意にするためEUIDsを生成し、すべてのマッチし、潜在的な重複処理を行い、一致ツールの一例です。

照合装置は、初期一括マッチに細心の注意を払っています。 3主要なステップに取ることによってそれから、マスター索引データ·ベース。最初のステップは、ロードされるデータのサブセットにレポートモードでリストされているバルクMatcherのオプションが実行されています。これは、重複と一致設定に関する必要な情報をユーザに提供します。

第二ステップでは、バルクのMatcherからコンフィギュレーションファイルを定義するしきい値に一致するクエリやルールに基づいてデータを処理することです。このステップでは、比較し、マッチした入力データに記載されているレコードのレコードが互いにリンクされている場合、データの重複を減らすことができます。一致する可能性がマスターインデックスデータベースにロードされたデータのイメージです。

最後に、この手順の最後のステップは、マスター·インデックス·データベースにデータをロードすることです。これは、Oracle SQL * LoaderまたはData Integratorのバルク·ローダーを使用して行われます。製品は、その後バルクMatcherの出力上で読み込まれ、その後データベースに直接ロードされます。

バルクMatcherのすべての3つの手順を実行しないかぎり、その後の作業は、それに応じて完了します。マスターイメージを準備するには、次の段階のグループとレコードがロードされ、マスター·データベースに応じて分配されるべきである。レコードは、ブロッキングクエリに基づいてグループ化されています。マッチツールついにグループの実際の文書に記載されている情報に応じて記録されます。

0 件のコメント:

コメントを投稿