2018/03/20

スペクトルデータの場合のSN比の考察(2)

(その1から続く)

 この例に限らず、累積データで解析するのは間違いというのが、筆者の一貫した立場である。

 データを横軸に対して累積するということは、データを平均化してしまうということである(累積値は、使用したデータの平均値×データ数である)。横軸の波長ごとの出力の違いが評価に反映されにくいことになる。これは横軸が期間や時間の場合でも一般的に言えることである。したがって、売り上げなどのデータを期間で累積して、ゼロ点比例のようなデータに変換して解析するのもまずいという意見である。

 平均化されて、ばらつきの情報が失われるばかりではない。スペクトルデータにおける波長の小さい側と大きい側の重要度に優劣はないはずである。λ=400nmの強度データとλ=800nmの強度データの重要度は同じであり、公平に評価されなければならない。しかし累積した場合には、短波長側のデータは累積数が少ないためにデータの絶対値が小さくなってしまい、SN比の評価に反映されづらくなってしまう。仮に長波長側に大きなピークがあれば、その波長の様子が大きくSN比に反映されてしまうことになる。

 また物理的、技術的にも問題がある。出力強度を波長ごとに累積した値に、いったいどんな物理的、技術的意味があるのだろうか。かりに横軸が時間のようなものであればまだ理解できるが、異なる波長ごとに反射・吸収した光の強度(材料種=構造によって変わる)の足し算である。品質工学とは、対象を技術的にあるいは物理的にとらえ、対象の品質(機能の安定性)を評価する学問ではなかったか。その点でも、「形がゼロ点比例風になればいい」といいうのは、あまりにも本質を忘れた、形式的な考え方と感じてしまうのである。
 ※MTシステムの場合は予測できれば何でもよいので、任意のデータの和などの項目を作成することは許されてよいだろう。これは再現性とは別の話である。

 では100歩譲って、上記の累積値に技術的な意味があるとしよう(実際、横軸の物理量によっては意味がある場合もある)。そのような累積値でSN比を求め、再現性もあったとしよう。つまり、SN比の改善に効果のある制御因子(スペクトル分析の場合、分析条件)が見つかったとしよう。さて、この場合の有用と思われる前記の制御因子は、あくまで「累積値データのN1、N2条件の違いを安定化する」効果があるものである。平均値相当のものが安定したということである。しかしこれは、おおもとの目的であった、「各波長ごとで出力強度が安定していること」を保証しない。波長ごとの強度のばらつきが大きくても、累積や平均であれば誤差(率)は小さくなるからである。したがって、累積値で再現性があり、有用な制御因子が見つかり、最適化をしたとしても、データを累積前のオリジナルに戻した時に、果たしてばらつきが改善されているかどうかということである。これはかなり怪しいと言わざるを得ないだろう。累積データが安定していることは、オリジナルのデータが安定していることの(かなり限定された)必要条件でしかない。特に、短波長側のデータは必然的には改善できないだろう。

 オリジナルのスぺクトルデータを用いて評価した場合の再現性の問題は、評価特性の悪さに起因するのであろう(制御因子の交互作用の問題も、おおもとを辿れば評価特性の問題であることが多い)。材料分析のような分析化学的なスペクトルデータでは、波長λの強度データと、λ+Δλの強度データではまったく異なる意味をもつ。材料種によってわずかなΔλの違いでピークを持つため、精密な材料分析が行えるのである。同じ材料を計測してスペクトルデータが横軸方向にもずれてしまう現象は、分析機器側のメカニズムとノイズの作用に起因するものである(材料は固定なので実際にλがシフトするわけではない)。そのような分析機器のメカニズムや働きに立ち返った「機能」の考察が必要である。


わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

スペクトルデータの場合のSN比の考察(1)

 昨年秋に参加した品質工学シンポジウムのあるテーマで、このような事例が議論になった。

 対象データはスペクトルデータである(図1のイメージ、筆者がフリーハンドで描いたもの)。横軸は波長(他に波数、周波数など)がとられることが多く、縦軸は出力の強度(intensity)である。例えば材料分析の場合に、材料に光(広い意味で電磁波)を当てて、そのときの反射や吸収の強度を、横軸の波長別に走査することで、材料に特有の波形(スペクトル)が得られる。これにより材料が何であるのかを特定する。

 このようなデータをノイズ因子(測定環境)N1、N2のもとで測定した場合、どのようにSN比を求めるかという問題である。

 普通に考えれば、それぞれの波長における基準波形[=材料ごとにあらかじめ精密に測定され、データベースとなっている]が信号となるが、ここでは標準SN比の考え方でN1とN2の出力Yの平均を使用する(これでも以下の議論に支障はないし、いつも基準波形が得られるとは限らないため)。

 問題は、このようなスペクトルデータの場合、N1とN2が縦(出力)方向にずれるばかりではなく、横(波長)方向にもずれてしまうということである。そのため、波長条件によっては頻繁にN1とN2の出力の大きさが入れ替わってしまうことが考えられる。

 N1とN2の出力の平均Y0を横軸(SN比計算のための信号)として出力Yのグラフを描くと、図2のようなイメージになる(フリーハンドで描いたもので図1には実際は対応しない)。このようなデータのもとで標準SN比を求めると、再現性が悪いらしい(発表者談)。


 そこで発表者は、図1のスペクトルデータの強度Yを横軸の波長方向に対して累積させたデータに変換させたという。つまり、N1条件のデータをY11,Y12,Y13,…,Y1kとすると、1つめのデータはY11、2つ目はY11+Y12、3つ目はY11+Y12+Y13、…という具合である。これによりデータは必ず単調増加となる(Yij≧0のため)。したがって、N1とN2のそれぞれの累積データを、これらの平均値を横軸としてプロットすると図3のような、一見すっきりとした形になる(これも筆者がフリーハンドで描いたイメージ)。

 発表者は、これでSN比を計算すると再現性が上がったという。果たしてこれでよいのであろうか。その2に続く。

わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

2018/03/07

直交表と品質工学⑨

まとめ 品質工学で使用する実験計画

1.パラメータ設計の内側直交表(制御因子)
 ・L18直交表を主に、L36、NOA18 など
 ・交互作用を因子の効果に交絡させて交互作用の有無(下流の再現性)をチェック

2.パラメータ設計の外側直交表(ノイズ因子)
 ・L12を主に、素数べき型のL4、L8を使用することも
 ・ノイズを調合(N1,N2)した場合は、信号因子とは多元配置(2元配置になる)

3.MTシステムの項目診断、項目選択
 ・素数×4型(L12、L20・・・)を主に、素数べき型も

4.殆直交表はNOA18以外ではQEでの使用例はあまり見かけず

5.SSDは多数の因子の荒いスクリーニングに使えるとの報告もあるが、最終的に直交表での下流再現性確認が必要なため、最初から直交表を用いるのが望ましい。

わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学⑧

過飽和計画(Super-Saturated Design)

表の自由度より因子の自由度が大きい場合をいう。
 cf. 通常のL18直交表 表の自由度17>因子の自由度15(未飽和)
 cf. L18+B’ 表の自由度17=因子の自由度17(飽和)

以下の例では21因子を12行の表に割り付けている。
殆直交表よりさらに直交性は低いが、多くの因子を少ない実験数で検討できる(正確な要因効果は無理)。
開発当初の因子のおおまかなスクリーニングに使える。


SSDのS/Wデバッグへの適用がQES2009で紹介されている。
QES2009-No.80 「ソフトウエア開発の基本機能」 松坂 昌司
※独自に「計画的欠番法」と言っている。

L36直交表のうち12列を抜き出した計画(SSD)でも、2因子の組み合わせの網羅率が95%と高いことを示した。
さらに過激に行数を減らしたものもある(L36-9行、L36-4行など)。




わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学⑦

殆直交表(NOA)

完全には直交していないがそれに近い表。
http://www.designcomputing.net/gendex/noa/
にいろんなNOAがあるので参照されたい。

下の例はNOA15(5^1*3^5)
各列の水準の相関係数を求めると,B~F列でやや直交が崩れているのがわかる。
列の自由度は4+2×5=14なので、直交表の自由度15-1=14と一致しており、「飽和」している。


A列とB列の交互作用列B’を加えたL18+B’列も殆直交表である。
B’列は交互作用A×Bが現れる。応急的に9因子目を割り付けることがある(A×Bがない場合)
BとB’列のみ直交していない。




わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学⑥

直交表とその種類
分類2:交互作用がいくつかの列に分散して現れるもの

・素数×4型(2水準系)・・・L12(2^11)
・2水準と3水準の混合型・・・L18(2^1*3^7)
・どの2列の交互作用がどの列に現れるか?
  交互作用が複数の列に表れるため線点図に表示できない。
  どの列に現れるかは詳細な解析が必要。
  cf. L18直交表の交互作用の解析は例えば、宮川:「品質を獲得する技術」
  特例として、L18の1列(A),2列(B)の交互作用のみ、ほかの列との交絡なく求めることができる。

・交互作用が分散することを利用して、
  外側のノイズ因子の割付に利用
  ソフトウェアのデバッグに利用
  多数の因子のスクリーニングに利用

・交互作用を制御因子に交絡させて、
  制御因子の交互作用の有無をチェック(パラメータ設計の確認実験)
  制御因子間の交互作用があると、下流で要因効果が再現しない可能性が高い。




わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学⑤

直交表とその種類
分類1:交互作用が特定の列に現れる もの

・素数^n型は基本的には特定の列に現れる・・・L16(2^15)の例
・どの2列の交互作用がどの列に現れるか?
 ⇒「線点図」を見る
   L16(2^15)直交表では、例えば、4列と15列の因子の交互作用は11列に発生する。したがって、11列に別の因子Zを割り付けた場合は、因子Zの効果と4列×8列の交互作用とは分離できない(=交絡する)。
  直交表の下部に表示されている「成分」を掛け算して求める。
  4列の成分c×15列の成分abcdの積は、abc2d→c2=1より、成分はabd→11列と分かる。
・交互作用を含めた要因効果を求めたいなど、現象究明的実験に用いられる。
・機能性評価の外側因子(ノイズ因子)に使用される例もある(非素数べき系L12などのほうがベター)。
・主効果の抽出が目的のパラメータ設計の内側直交表(制御因子)には用いないほうがよい。


わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学④

直交表とは

一番簡単なL4直交表の例
・表の縦列の数字1~4は、実験ナンバー
・表の行にある因子A~Cは、実験条件を指定する因子名
・A1、B2などは、因子の条件を2つの値(これを水準という)に変化させて実験することを示している
・このように当てはめることを「直交表に割り付ける」という
・X1~X4は、実験ナンバーごとに指定された条件のデータ

直交表の性質
・実験ナンバー1と2の条件を足してみると・・・(2×A1)+(B1+B2)+(C1+C2)となり、因子Aに関してはA1だけを使うが、因子BとCに関しては1と2の値を両方使うことなる。
・因子BとCの効果は、1と2で打ち消されていると考えると、実験ナンバー1と2のデータの和には、因子A1の情報しか含まれていないと考えられる。
・同様に、実験3と4のデータの和には因子A2の情報だけが、実験1と3のデータの和には因子B1の情報、実験1と4のデータの和には因子C1の情報だけが含まれている。
・このようなお互いに対して独立している性質を「直交している」という。
・4個のデータから3個の因子の効果が計算できる。実験に直交表を活用すると、非常に効率がよく、広く用いられている。


わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学③

多元配置(総当り)
・もっとも基本的な直交実験
・(ほぼ)すべての主効果・交互作用が求まる
  ※求まらない場合もある。
   ①実物実験で実験誤差と交互作用が交絡する場合
   ②下記の例では、残差eと交互作用A×Bとは分離できない


因子Aに反復をいれてランダム化すると自由度が増えて、分離できるようになる。


わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学②

「直交」とは?

①実験計画の直交性: 因子の水準組み合わせが同じ回数出てくる場合、その計画は「直交している」という→「直交配列」

②因子の効果の直交性: 2因子の効果の足し算で総合の効果が表せるとき、その2因子の効果は「直交している」(交互作用がない)という

③上記の①②が成り立っているとき、直交表のすべての列の因子の効果が正しく推定できる。→大幅な実験数削減が可能。

④交互作用がある場合は、それが現れる列を空けておけば推定できる。空いていない場合は、その列の因子の効果と分離できない(交絡する)。

⑤上記の②成立の場合、直交配列以外でも効果の推定可能(殆直交表)。

JIS Z8101-3「直交配列」の定義
「因子のすべてのペアに対して、因子水準について考えられる処理組み合わせが同数回現れるような処理組み合わせの集合」。
総当り(多元配置)、一部実施(直交表)の区別はない。

わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト

直交表と品質工学①

実験計画法では、いろんな意味で「直交」という概念がでてくる。

・実験計画が「直交」・・・組み合わせが同回数→ex.直交表
・要因(因子)の効果が「直交」・・・効果が独立⇔交互作用
・成分が数学的に「直交」・・・2乗和の分解(分散分析、SN比)
・成分が物理的に「直交」・・・エネルギー保存則(有効エネルギーと有害エネルギー)

今回は主に、「実験計画における直交、直交表」を中心にご紹介する。
以下に直交表を中心としたさまざまな実験計画の分類を示す。


ほかに、応答曲面法などの分野で用いられる「複合計画」「Box-Behnken計画」「最適計画」などもある。

わかりやすい品質工学(タグチメソッド)のコンサル・研修・セミナー・講演のことなら
株式会社ジェダイト