- 「制約条件から実験点を探索」はどのようなときに使用すべきですか?
- 「分析」と「最適化」はどのように使い分けたらよいですか?
- 定式が正しくないようです。/正常に機能しない定式があります。修正方法を教えてください。
- スペックの目標を調整しましたが、ラウンドが良くなりません。
- このモデルは、アウトプットの精度が高いことを示しています。提案が目標を達成していないのはなぜですか?
- 「低サンプリング警告」/「サンプリングエラー」が表示されます。これはどういう意味ですか?
- 得られた提案に重複した定式があるのはなぜですか?
- 制約条件セットでエラーが発生するか、[テスト実施]をクリックするとエラーが発生します。これは何を意味しますか?どうすれば修正できますか?
- インプットの種類が多すぎるというエラーが発生します。なぜですか?どうすれば解決できますか?
- 提案に沿って表示される予測が有意ではありません/精度が非常に悪いです。なぜですか?
- 特定のインプットを予測因子として明示的に設定しましたが、モデルに表示されません。なぜですか?
- モデル作成時に異なる処方がマージされるのはなぜですか?
II. トラブルシューティングガイド
1.「制約条件から実験点を探索」はどのようなときに使用すべきですか?
このオプションでは、使用する原料の数によって定義される必要な数の実験のみで、最大限の情報を取得するために、最適距離の実験が生成されます。このオプションは、次のシナリオでスクリーニングラウンドを生成するために使用する必要があります。
- 対象のアウトプットに対する測定値がない。
- すべてまたは多数の原料が新しいため、こうした原料について知りたい。
- 提案にバリエーションを加えたい。
2.「分析」と「最適化」はどのように使い分けたらよいですか?
どちらの場合も、機械学習(ML)モデルが作成されます。主な違いは、「提案」はモデリング上でアルゴリズムを実行し、制約条件セットで選択された範囲を考慮して、スペック内のアウトプットに対する推奨事項を提供することです(インプットに設定された範囲は、推奨事項の取得にのみ影響し、モデリングプロセスには影響しません)。サンプリングアルゴリズムの図例については(4)を参照してください。
どちらの場合も、制約条件セットが使用されている場合、「予測因子」が「✓」になっているインプットがモデリングに使用されます。「追加の原料を提案しますか?」を選択すると、予測因子のリストが自動的に拡張される場合があります。そのほかに、以下のような違いがあります。
分析では、次の目的でモデルが作成されます。
- ばらつきを説明するために必要な数の予測因子を含める
- モデリングされたアウトプットの精度を把握する
- 外れ値を見つけ削除する
- 「エフェクトサイズ」表で、最も重要な予測因子を把握する
提案では、次の目的でモデルが作成されます。
- 効率的にスペースを探索するだけでなく、アウトプットを最適化する最良の推奨事項を取得する
- 方向性の取得と最適化に必要な予測因子のみを含める
- 「エフェクトサイズ」表で、最適化に最も重要な予測因子を把握する
3.定式が正しくないようです。/正常に機能しない定式があります。修正方法を教えてください。
- 使用したくない原材料が含まれています。
Uncountableのアルゴリズムは、たとえば新しい原料よりもより多くの情報を持っている原料を優先する場合があります。段階的に廃止されていたり、提案に常に含まれているために避けたい原料がある場合は、それらを制約条件セットに追加して「使用しない」に設定することをお勧めします。
- 表示される定式がどれもよく似ています。もっと違いを持たせたいです。
問題(3)と関連のある問題です。(3)の問題に加えて、制約条件が厳しすぎる可能性があります。コストなどの計算に制約条件を課す場合によく見られます。これは、サンプリング レートが低いことに関連している可能性があります((4)を参照)。
考えられる解決策:
- 原料カテゴリの「# 原料 存在」で範囲を設定する。
- 提案であまり現れない、またはまったく現れない原料の使用可能性を高く(>0.5)します。あるいは、頻繁または常に出現する原料の使用可能性を低く設定します。
(使用可能性は、0~1の値です。0は「使用しない」に相当し、1は「常に使用」に相当します)。これには、「詳細設定を表示」を選択します。
3.強制的にばらつきを与えるには、「制約条件から実験点を探索」を使用してみてください(Q1を参照)。
- 特定の原料の量を考慮すると、提案が失敗することはすでにわかっています。
提案された原料の範囲では明らかにうまくいかない場合は、次のことを試してください。
- より重要なアウトプットをはっきりとさせるために、スペック内の特性の優先順位を調整する。それらのみを「高」に設定し、残りを「中」または「低」に設定する。使用されている原料とその範囲により、特性がすでに満たされていることが確実な場合は、それを「無視」に設定するとうまくいく場合があります。
- もっと大きなデータセットを使用してみる。「すべてのプロジェクトを使用」ではなく「現在のプロジェクトを使用」オプションを使用して提案ジョブが実行された可能性があります。
4.スペックの目標を調整しましたが、ラウンドが良くなりません。
- 手動で制約条件を定義:制約条件を手動で選択(原料の追加、範囲の設定など)して提案を生成している場合、問題は通常、スペックによって目標の達成を目指していても、定義した範囲が改善を制限することが原因です。これは、特定の原料が、提案の1ラウンドですべての処方に対して設定の最大値あるいは最小値に近い場合に見られます。
解決策:
- 主要な原料の範囲を調整します。例:アウトプットが向上しない場合は、それに最も相関のある原料の範囲を調整してください。
- 「詳細設定」をクリックし、「原料の範囲と確率を調整?」チェックボックスをオンにすることで、プラットフォームで範囲を調整できるようになります。
- 自動で制約条件を定義:プラットフォームがインプットを自動的に選択する提案を取得している場合は、制約条件セット内の一般情報を統合することによって提案に指針を与えてみてください。
考えられる解決策:
- 常に使用すべき原料を追加する。
- 原料を制約条件セットに追加し、「使用しない」に設定することで禁止する。
- 原料のカテゴリに制約を追加する。たとえば、処方に1~3個の皮膚軟化剤が含まれている必要があることが先験的にわかっている場合は、制約条件セットに皮膚軟化剤を追加し、「# 原料 存在」を1~3に設定します。
5.このモデルは、アウトプットの精度が高いことを示しています。提案が目標を達成していないのはなぜですか?
検討事項は、重要度でランク付けされます。
- 精度が高くても、提案された処方がうまくいくかどうかは保証されません。処方のパフォーマンスは、許可される原料と設定された制約条件によって制限されます。
- 多くの場合、複数の特性が同時に最適化されます。つまり、提案では考慮されたすべての特性と優先順位の「スイートスポット」を目指します。アルゴリズムがトレードオフを解消しようとしているとしても、アウトプット間にトレードオフがある場合、1つ以上の特性の目標を達成できない可能性があります。
- 制約条件にトレーニングデータで使用されていない原料がある場合、最初の実験は最適化を目指すものではなく探索的なものになることが予想されます。新しい原料に、特性を最適化するための重要な計算に用いられるすべての属性の値が含まれている場合、これは回避できます。
6.「低サンプリング警告」/「サンプリングエラー」が表示されます。これはどういう意味ですか?
このエラーが表示される背景:Uncountableでは、1)モデルを作成し、2)モデルと制約条件(これは自動または手動で定義されます)に従って提案する処方を取得する、というメカニズムを通じて提案事項を取得します。「低サンプリング警告」や「サンプリングエラー」が表示された場合は、2番目のメカニズムのみに関連するため、使用される原料、その範囲、およびそれらが含まれる詳細制約条件が原因です。
低サンプリング警告:処方提案アルゴリズムは、制約条件内のインプットの範囲に従って、何千もの可能な処方を生成します。これらの処方は、既存のデータを考慮して、重複が存在しないように、またこれらの処方が互いに十分に遠いものであるように生成されます。次に、アルゴリズムは、生成した処方の何パーセントがすべての線形制約条件と詳細制約条件に準拠しているかをチェックします。すべての制約条件を満たす処方が生成された処方の合計の3%未満の場合、警告が表示されます。これは、コストの最適化を重視するプロジェクト(またはコストに類似したその他の計算)の場合によく表示されます。その意味は、制約条件が厳しすぎるか、空間を使いきってしまい、似たような提案や同じ提案が繰り返されるということです。
サンプリングエラー:通常は実行不可能な制約条件が原因で、定式が正常に生成されていません。
解決策:一部の制約条件を緩めてみてください。詳細制約条件を順番に削除し、提案ジョブで影響をテストすると効率的にトラブルシューティングできます。
7.得られた提案に重複した定式があるのはなぜですか?
これは通常、空間が厳しく制限されているためにサンプリングレートが低い場合に発生します。33)を参照してください。定式が非常に似ているのに制約条件が厳しくない場合は、30)のb)を参照してください。
8.制約条件セットでエラーが発生するか、[テスト実施]をクリックするとエラーが発生します。これは何を意味しますか?どうすれば修正できますか?
制約条件セットに明らかに特定できそうなエラーがある場合、次のようになります。
一部の実現不可能な制約条件は、ページの右側にある[テスト実施]をクリックして特定できます。
- 「推奨の実験」ページで追加の原料を自動で選択させる場合(「追加の原料を提案しますか?」を選択した場合)、これは問題ありません。
つまり、一連の制約条件は原料空間を部分的に定義するのみです。たとえば、特定の原料を強制(常に使用するように設定)するか禁止(使用しないように設定)するだけといった定義です。
- 一連の制約条件によって空間が完全に定義されている場合は問題です。このエラーは、制約条件が実行不可能であることを示しています(「推奨の実験」ページで「追加の原料を提案しますか?」を選択しない)。
原因と解決策の例:
- コストなどの詳細制約条件が厳しすぎます。すべての原料に関連する属性(個々のコストなど)があることを確認するか、それらの制約条件を緩和してみてください。
- 原料の範囲と確率から、合計を100%達成することは不可能です。
- カテゴリ内の原料の範囲と使用するかどうかの選択(常にする、しないなど)により、そのカテゴリの原料の合計または# 原料 存在を達成することが不可能になります。
9. インプットの種類が多すぎるというエラーが発生します。なぜですか?どうすれば解決できますか?
前セクションの17)を参照してください。原料の種類が多数あると効率的に最適化することはできません。
解決策:
- 制約条件から原料を削除するか、一般制約条件(カテゴリの原料の合計の# 原料 存在など)を削除します。
- 原料の種類の数に制限があるため、一部の原料を「常に使用」にして固定値(同じ最小値と最大値)に設定します。
10.提案に沿って表示される予測が有意ではありません/精度が非常に悪いです。なぜですか?
提案に従って示される予測は、提案ジョブで生成されたモデルに従った推論値であり、最も重要な予測因子と方向性を明らかにすることが目的です。このモデルは、分析で生成されるモデルを合成したものである可能性があります((29)を参照)。これは、ばらつきの一部が提案で使用されるモデルでは説明できない可能性があることを意味します。
厳選された制約条件セットを使用し、分析からモデルを構築すると、より正確な予測を取得できます。
詳しくは、前セクションの(27)、(28)、(29)を参照してください。
11.特定のインプットを予測因子として明示的に設定しましたが、モデルに表示されません。なぜですか?
ノイズを低減し、次のような望ましくない予測因子をモデルから除外するために、いくつかのヒューリスティックが用意されています。
- 使用回数が3回未満のインプット。
- 2つの値でしか使用されないインプットの一部。たとえば、インプットAは400回使用されましたが、使用されたのは0.5と1の2つの離散値のみだった場合などです。
特定の有効なカウントは、モデル化されたアウトプット、マージされた処方、外れ値の除去などによって条件付けされます。つまり、関連するアウトプットの測定値を含む処方(マージ後)に、予測因子として設定された特定の原料が含まれていない場合、そのインプットもモデルから除外されます。
12.モデル作成時に異なる処方がマージされるのはなぜですか?
同じ処方、または誤差が小さくほぼ同じ処方はマージされます。つまり処方が2回テストされた場合、それらの重複は反復として扱われ、関連する測定値が平均化されるということです。
処方が予測変数であるかどうかを決定するプロセスでは、自動または手動で選択されたインプットのみが考慮されます。
異なる2つの処方が誤ってマージされた場合、それらの処方間で異なる原料や工程条件の一部が非予測因子として扱われていることを意味します。
解決策は、そのようにマージされた中で異なるインプットの少なくとも1つを予測因子として設定することです。