• Tidak ada hasil yang ditemukan

官能評価実験の計画と結果の解析 - J-Stage

N/A
N/A
Protected

Academic year: 2023

Membagikan "官能評価実験の計画と結果の解析 - J-Stage"

Copied!
9
0
0

Teks penuh

(1)

はじめに

筆者に与えられた課題は「官能評価の実験計画法」で ある.

実験計画法には「実験の計画」と,得られた「結果

(データ)の解析」の2つの要素が含まれている.

実験計画法は極めて広範囲な分野を含み,全体像を数 ページの枠内で取り上げても有益な解説とはならない.

そこで,3つの具体的な問題を取り上げて数値例を使っ て解説する.

(1) 実験の計画の基本は,実験の大きさの決め方であ る.また,実験の目的を満足するような実験を計画する ことも大切である.

2項分布を使って,仮説検定と区間推定の基礎から説 明する.

(2) 官能評価は人間の感覚によって評価するので,個 人差が入るだけでなく,同一人でも評価がぶれる.そこ で,各人に複数回評価してもらって,より信頼性の高い 推定をしたい.

(3) 複数個のサンプルを複数人の評価者(以下パネル と呼ぶ)に評点をつけてもらう場合を取り上げる.評価 基準や,評点のつけ方がパネルによって異なるので,結 果の評価には注意が必要である.このようなデータに対 して多変量解析の手法の一つである主成分分析が使われ る.しかし,その使い方には注意が必要である.

次章以降に,上記の3つの課題を取り上げる.

解 析 に はExcelを 用 い,Excelフ ァ イ ル はhttp://

www.jsbba.or.jp/wp-content/uploads/file/pub/kasei  5102.xlsからダウンロードすることができる

Excelによる解析手順の細かい説明はページの制約か ら本文では省略し,Excelシートに記す.

読者は自分でパソコンを操作しながら読むことによっ て,内容の理解を確かなものにすることができるであろ う.

実験の計画

この章の最初の節は仮説検定の基本的な考え方を説明 するものであるから,統計解析の基本をマスターしてい る人は読み飛ばしてもよい.しかし,ここに述べる基本 を理解していないと思われる誤用例がしばしば見られる のは事実である.

1.  仮説検定

これから取り上げる課題は,論文を書くための調査で はなく,企業が新製品の開発,商品化などの現実の場 で,何らかの決定を下すための調査である.

統計解析のなかで,仮説検定は大きな役割を果たす.

以下,簡単な事例を想定して,問題点を説明する.

例 現在市販している製品の改良品を開発した.従来

セミナー室

食品の官能評価法-6

官能評価実験の計画と結果の解析

芳賀敏郎

(2)

品と比較して改良品を好む人のほうが多いことを一般消 費者調査で確認したい.そのためには,何人の一般消費 者について調査するのがよいであろうか?

この問題の解を求めるに先立って,次のような実験結 果について考える.

この製品のユーザーと考えられる母集団から =50人 の一般消費者をランダムに選んでパネルとした.各パネ ルに2つの製品を提示して,「2つの商品のどちらを購入 しますか」という質問をした.

その結果   =30人(全体の60%)の人が改良品を選ん だ.

過半数の人が改良品を選んだ.これから,改良品を新 製品として市販するという決定を下せるであろうか?

ということは,母集団(一般消費者全体)の半数が改 良品を選ぶとしても,50人のサンプル中の30人が改良 品を選ぶ可能性があるからである.その可能性を考慮し て判断するのが仮説検定である.

母集団が改良品を選ぶ割合を 

π

 で表す.

π

=0.5のと き, =50人のサンプルで  =30人以上が改良品を選ぶ 確率が表

1

の1行目の最後の「上側確率」に求められて いる.

表1で「下側確率」は   が30以下の確率,「上側確率」

は   が30以上の確率である.後者は約10%である

*

1 これから改良品と従来品と同じあっても  ≥30という 結果が得られる確率が1割もあることがわかる.この確 率を 値と呼ぶ.

この確率がいくら以下ならば試作品を商品化するか は,誤って改良品が従来品以下であっても商品化するこ とによる損失などによって決めるべきであるが,標準と して5%が用いられる.

この例では, =0.101>0.05であるから,

π

=0.5を否定 することはできない.

それでは   がいくつ以上であれば 

π

=0.5を否定するこ とができるであろうか?  =31, 32と変化させて を計

算すると =0.059, 0.032となる(表1の2, 3行目).これ

から, ≥32であれば ≤0.05となることがわかる.

これは実験結果が得られる前に計算しておくことがで きる. 値を簡単に計算できなかった時代にはこの方法 が標準的な方法として用いられた.

π

 >0.5を検証したいときには,これとは逆に 

π

 ≤0.5を 仮定する.これを帰無仮説と呼び  0:

π

=0.5と記す.帰 無仮説が正しいとき, ≥32の確率が0.05より小さくな ることから, ≥32のとき,帰無仮説を否定し 

π

 ≥0.5で あると判断する. ≤32を帰無仮説を棄却する(否定す る)領域なので棄却域と呼ぶ.これが仮説検定の基本的 な考え方である.

表1では   を一つずつ増やしているが,通常は,試行 錯誤で   を変化させて求める.

2.  検出力

前節に述べた考え方により, ≥32という結果が得ら れたとき,

π

=0.5を棄却し,改良品は従来品よりもより 多くの人に選ばれると結論し,改良品を商品として市場 に出すことになる.

ここで,もし改良品を好む人の本当の割合が 

π

=0.6で あるとき,改良品が市場に出る確率はいくらになるであ ろうか?

表1の計算表に 

π

 =0.60,  =32を入力すると,上側確率 が0.336となる.すなわち,改良品は従来品よりも好ま れるにもかかわらず改良品が市場に出る割合はわずか 1/3に過ぎない.逆に2/3は改良品は埋もれてしまう.

ここで得られた0.336は検出力と呼ばれる.

π

の値を0.05刻みに変化させて検出力を計算してグラ フ化すると図

1

の中央の曲線が得られる

*

2

横軸が 

π

 =0.6のときの縦軸の値(検出力)が0.336で

あるが,

π

 =0.7の検出力は0.859と1.0に近づいた.この

曲線を検出力曲線と言う.

π

 = 0.6のときでも改良品が市場に出される確率をもっ と大きくしたいのであればサンプルの大きさ をもっと 増やさなければならない. =100として,同様の計算 をすると棄却域は  ≥59となり,検出力曲線は図1の上 の曲線で表される.

π

 =0.6に対する検出力は0.623とな る.検出力をもっと高めたければ, をもっと大きくし なければならない.

逆に =25とすると,下の曲線が得られ,

π

 =0.7のと き,検出力は0.512に過ぎない.

*1   が30以下の確率は=BINOMDIST (30, 50, 0.5, TRUE), が30以上の確率は=1−BINOMDIST (30−1, 50, 0.5, TRUE)

で求められる.

 両者の合計は1.042と1を超える値になる.これは =30の確率 0.042が両方に含まれるからである.

*2このグラフを作成すための計算過程はExcelシートに含まれ,

それに修正を加えると,条件を変えたグラフを作成することがで きる.

表12項分布の計算表

π 下側確率 上側確率

0.500 50 30 0.941 0.101

0.500 50 31 0.968 0.059

0.500 50 32 0.984 0.032

(3)

π

 がいくらの改良品は高い確率で商品として出荷した いかを決める.ふつうこの確率は0.8 〜 0.9に設定され る.

設定された条件に従う検出力曲線が得られる を試行 錯誤で求めることになる.試行錯誤の初期値を決めるの に図1のグラフが役立つであろう.

注意 改良品を選ぶ人の割合 

π

 が0.55以下のときは商 品化したくないときには,帰無仮説を 

π

 =0.55とする.

帰無仮説はいつも 

π

 =0.5であるとは限らない.検定の結 果をどのように利用するかによって,適切な帰無仮説を 設定しなければならない.

この場合の検出力曲線は 

π

=0.55に対する検出力を計 算しなければならない.

3.  区間推定

=50,  =30で,改 良 品 が 得 ら れ ば れ た 割 合 は30/ 

50=0.60であった.この割合が帰無仮説の 

π

=0.5から誤 差の範囲を超えて離れているかどうかを調べるもので,

結果は「有意差が認められる」と「有意差が認められな い」のいずれであるかが結論である.

それに対して,本当の割合 

π

 が95%が含まれる範囲 を求める方法がある.この例について計算すると,

  0.48<

π

という結果が得られる.この方法を区間推定と呼ぶ.こ の区間に帰無仮説 

π

=0.5が含まれ,帰無仮説を否定する ことはできない.すなわち,仮説検定と同じ結論が導か れる.

上の例は,

π

 >0.5を確認するための検定であった.こ れを片側検定という.これに対応する区間推定は上に示 すように片側だけが範囲となる.

これに対して,両側の値を設定する区間推定も一般的 に用いられる.上の例に適用すると

  0.45<

π

<0.74

となる.下側に外れる確率は0.05/2=0.025となるので,

下限値は0.48が0.45と区間の範囲が広がる.

この区間推定の結果を見ると,改良品を購入したいと 思う人が74%かもしれない.これが本当だとすれば,

仮説検定が有意でなかったからといって改良品を捨てる ことはできないであろう.

しかし,信頼区間の下限をみると改良品を購入したい 人の割合が45%かもしれない.このような状況では経 営者は改良品の商品化に踏み切れないであろう.

なぜこのようなことが起こるのだろうか? これは信 頼区間の幅が広過ぎるからである.それでは,信頼区間 の幅を狭くするためにはどうしたらよいであろうか.

信頼区間を求める近似公式は   p p p

n p p p

−1 96. (1− ) < < +

π

1 96. (1n− )   (1)

である.信頼区間の幅を狭くするためには分母の (パ ネルの人数)を大きくする必要がある.

式 (1) は 近 似 式 で あ っ て, =0 (  =0) ま た は =1 

(  = ) のとき信頼区間の幅が0になったり,信頼区間 の範囲が0 〜1の外側に出たりする.近似度の高い方法 もあるが,ここでは説明を省略する.

実験に先立って上に述べたような計算をするのが面倒 であるという人のために,割合 

π

  の区間推定(両側信 頼率95%)の幅が,

π

,   によってどのように変化するか 1.0

0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1

0.00.5 0.6 0.7 0.8 0.9 1.0

100 50 検出力 25

π 図1検出力曲線

0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0

2000 500 100 50 20

0.0 0.1 0.2 0.3 0.4 0.5 0.6

実測割合

信頼区間

図2割合の信頼区間の π による変化

(4)

を示すグラフを図

2

に示す.

前章で用いた =50,  =30の場合を取り上げて,

π

 の 区間推定値を求める手順を説明する.

横軸に観測された = / = 30/50 = 0.6を取り, = 50 の2本の曲線(外側から2番目の曲線)の縦軸の値を目 盛から読み取る.下側が0.46, 上側が0.73である.

紙面の制約から0.6 <  をカットした.このグラフは 

(0.5, 0.5) に対して点対称であるから,0.6 <  のときは横 軸が1− について縦軸の値を1から引けばよい

*

3

4.  実験の方法

前項までに説明した考えに基づいて が決まったら,

すぐに =500の調査を実施するというのは危険である.

まず, が数十程度の予備調査をし,その結果に基づ いて計画を再確認するのが良いであろう.

フェリスの2点嗜好法 1.  目的と解析手順

どの製品を市場に出すかを決めるためには,もっと丁 寧な実験が必要である.

このための調査では一般の消費者が官能評価者(パネ ル)となる.

消費者は本当にどちらかの製品が好きである場合もあ るが,どちらが好きかはっきりしないで,何となくどち らかの製品を選ぶ消費者もいるであろう.

そこで,消費者を本当に製品 1または 2のいずれか を好む人とどちらでもよい人の3つに分け,それぞれの 割合を 

π

1

π

2

π

0 で表す.

人の消費者に 12の比較調査を2回実施する.こ の2回の繰返しは,被検者にわからないように実施する 必要がある.そのために,数組の比較を依頼し,そのな かに同じ対を含ませるというような方法が用いられる.

提示の順序を逆にするなどの工夫も必要である.また,

日を変えて調査することも考えられる.

=150人について調査し,( 11), ( 22), ( 12), 

21) と答えた人が,それぞれ,82, 38, 16, 14人で あった.

このような調査結果を表

2

左半分のように整理する.

上の2行は2回の評価が一致する人,中央の2行は2回 の評価が異なる人で,それぞれの人数の合計が「小計」

の行に求められている.

ど ち ら で も よ い 人 は,( 11), ( 22), ( 12), 

21) の4通りの組合せからランダムに選んで答える と考える.2回が一致する確率と一致しない確率はとも に50%である.

一致しない人が30人いるということは,どちらでも よい人はその2倍の60人いると予想される.2回が一致 する回答した人数のなかには,どちらでもよい人が平均 的に30人含まれていると考えられる.この人数を引く と,本当にどちらかをよいと判断する人数になるであろ う.この関係を図

3

に示す.

このような考えで求められた数値が「補正後」の列に 求められている.

これから,

π π π

 

π π

1 1  1

1 2

150 0 44767 0 744

= = =

+ =

. , * .

π π π

 

π π

2 2  2

1 2

150 0 15323 0 256

= = =

+ =

. , * .   (2)

π

0 60

150 0 400

= = .

と推定する.

式(2) で,

π 

1

π

1の推定値を表す.

π

0=0.4で,半分 近くの人はどちらでもよい.

右の

π  *

1は評価がはっきりしている人のなかで 1を選 んだ人の割合である. 1をよいという人は 2をよいと いう人の約3倍 (

π  *

1/

π  *

2=0.744/0.256=2.9) である.

これらの関係を図

4

の三角グラフで表す.

*3 Excelファイルには右をカットしないグラフが表示され,α,  の 値を任意に設定したグラフを描くことができる.

表2フェリスの2点嗜好法

第1回 第2回 人数 補正後 割合 (%)

A1 A1   82   67.0   44.7   74.4 A2 A2   38   23.0   15.3   25.6

小計 120   90.0 100.0

A1 A2   16

A2 A1   14

小計   30   60.0   40.0 150 150.0 100.0

82 30 38

67 60 23

観測数

補正後

A1, A1 A1, A2A2, A1 A2, A2

π1 π0 π2 図3フェリスの方法の考え方

(5)

縦軸の目盛はどちらでもよい人の割合

π

0である.

π

0

=40%に水平な点線を引く.

横軸の目盛はよさに違いのある人のうちで 2をよい という人の割合

π  *

2である.横軸の

π  *

2=25.6%の点と三角 形の頂点を結ぶ点線を引く.

2つの点線の交点が,得られたデータに対応する点と なる.

その点が,三角形のどのへんにあるかによって対応を 決める.

正三角形の左下は

π

1=1,右下は

π

2=1,頂点は

π

0=1で ある.

4つの領域のどこにプロットされるかによって,次の ような対応を取る.

左下なら 1を商品化する.

右下なら 2を商品化する.

中央下なら, 1を好む人と 2を好む人がいるの で,両方を商品化しないと市場を抑えることができ ない.

上なら,どちらを商品化してもよいと考えられ る.

ここで,4つに分ける限界線をどこに引くかは,商品 の種類などにを考慮し,責任者が決めなければならな い.図4では,

π

0=0.5の位置に水平線を引き,

π

1

*

=1/3, 

π

2

*

=1/3に2本の斜線を引いている.

このデータから得られた点は,左下の領域に含まれる ので, 1のみを販売することになる.

表2の計算表は「人数」の列の4つの数値を入力する と,計算値が更新され,グラフのなかの点の位置も移動 する.

また,右のグラフの3本の分割線は計算表の下のグラ フ作成用の表で,

π

0

π

2

*

の値を修正すると自動的に更新 される.

2.  パラメータの区間推定

今回は,統計の専門家ではない官能評価の利用者を対 象として書いてきた.この節は,その範囲を超えるが,

官能評価データの解析の今後の発展に寄与できると考え て記すものである.

Ferrisの方法は,官能評価には不確定性があるので,

同じ人が複数回評価してもらい,できるだけ正しい結論 を出そうとする意図で導き出されたものである.とする と,前節に求めた2つのパラメータの点推定値だけでな く,信頼区間を求め,図4のグラフも,観測点の周りに 信頼区間の楕円を描きたい.

そのためには,パラメータ

π

0

π

1

*

を最尤法で求める解 析が必要となる.そのための計算表を表

3

に示す.

左上の2列に観測された度数を入力する.

右下の太枠で囲まれたセルに,パラメータ

π

0

π

1

*

の適 当な初期値を入力する.これらのパラメータの値を使っ て,phatの列を次の式で計算する.

  1 1:

π

0/4+(1−

π

0)

π

1

*

  2 2:

π

0/4+(1−

π

0) (1−

π

1

*

)   1 22 1:

π

0/2

「phat」 から 「f」 が出現する確率はBINOMDIST関数 で計算される.この値を尤度として,4つの尤度の積を 最大にするのが最尤法である.積を最大にする代わりに その自然対数の−2倍の和を最小にする.その値が 「L」 

の列に計算されている.計算式は

 =−2 LN (BINOMDIST(f, N, phat, FALSE) である.

下の太枠(「L計」)の中にはこれらの値の合計を計算

0 25 50 75 100

100 75 50 25

0

図4フェリスの2点嗜好法のグラフ

表3最尤法による π の推定

初期値 結果

phat L phat L

A1A1   82 0.495   7.060 0.547   5.457 A2A2   38 0.355 12.331 0.253   5.188 A1A2   16 0.075   6.444 0.100   4.581 A2A1   14 0.075   5.069 0.100   4.467

150

π0   0.300 π0   0.400 π1*   0.600 π1*   0.744 L計 30.905 L計 19.692

表4パラメータの区間推定

パラメータ 推定値 近似標準誤差 下側信頼限界 上側信頼限界 p0 0.400 0.058 0.293 0.520 p1* 0.744 0.049 0.652 0.847

(6)

する.

この値を最小にする2つのパラメータをソルバーで解 いた結果が,表3の右半分である.

その結果は,前節で求めた結果に一致する.

次に,パラメータの信頼区間を求める.その方法はか なり複雑で,Excelで求めるのは実用的ではない

*

4. SAS社のJMPを使って解析した結果を表

4

に示す.

この信頼区間は「プロファイル尤度法」という方法で 求められている.

信頼区間の幅は予想以上に大きいであろう.

この節で取り上げた問題は,「非線形モデル」,「最尤 法」,「プロファイル尤度法」など,まだ一般に普及して いない考え方と方法を用いて解析されている.これらの 点については次の本に基礎から詳しく解説しているの で,興味ある方は参照していただきたい.

芳賀敏郎,『医薬品開発のための統計解析,第3部  非線形モデル』,サイエンティスト社,2010.

3.  補足

この章で取り上げたように,データにあるモデルを仮 定して,データを解析するとき,大切なことは機械的に 解析するだけではなく,モデルが妥当であるかどうかを 注意深く検証することが必要である.

たとえば,フェリスの方法を適用したとき,( 12), 

21) が半々と言えるかどうかを検証する必要があ る.もし,半々から有意にはずれているときは,なぜそ のようなことが起こるかを考えねばならない.このよう な場合の検定では,第1種の誤りの確率 

α

 を0.05とする

検定ではなく,

α

=0.20位に大きくして,見逃しの危険

(第2種の誤り)を抑えるのがよいであろう.

評点データの解析 1.  データとグラフ化

一人の評価者に複数のサンプルを示し,「購入したい」

という評価項目について,10点満点で答えてもらい,

5

上のようなデータが得られたとする.

行のAはサンプル,列のPはパネルで,この例では5 サンプル,10人の評価者である.サンプル番号を ,パ ネル番号を ,評点を で表す.

サンプル間の差を解析する,最も単純な解析は繰り返 しのある1因子実験データとして分散分析を適用する方 法である.

得られた分散分析表を表

6

の上半分に示す.

この方法は果たして適切であろうか?

横軸に評価者 を,縦軸に評点 を取ってグラフ化す

*4 Excelファイルには,「データテーブル」機能を使って信頼区間 の近似値を求めている.

表6分散分析表 1因子実験

要因 平方和 自由度 平均平方 F p

サンプル間   60.1   4 15.03 4.91 0.0023

誤差 137.8 45   3.06 1.00

全体 197.9 49

乱解法実験

要因 平方和 自由度 平均平方 F p

サンプル間   60.1   4 15.03 6.74 0.0004 パネル間   57.5   9   6.39 2.87 0.0117 誤差2   80.3 36   2.23 1.00

全体 197.9 49

表5評点データ

P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 平均

A1 6 8 7 8 7 2 9 5 5 6 6.3

A2 4 6 5 6 5 4 7 7 6 4 5.4

A3 7 4 8 7 8 5 6 6 5 4 6.0

A4 3 2 4 5 4 1 8 8 6 5 4.6

A5 9 10 8 10 7 6 9 6 7 7 7.9

平均 5.8 6.0 6.4 7.2 6.2 3.6 7.8 6.4 5.8 5.2 標準偏差 2.4 3.2 1.8 1.9 1.6 2.1 1.3 1.1 0.8 1.3

P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 平均

A1 0.2 2.0 0.6 0.8 0.8 1.6 1.2 −1.4 −0.8 0.8 0.3 A2 −1.8 0.0 −1.4 −1.2 −1.2 0.4 0.8 0.6 0.2 −1.2 −0.6 A3 1.2 −2.0 1.6 −0.2 1.8 1.4 1.8 −0.4 −0.8 −1.2 0.0 A4 −2.8 −4.0 −2.4 −2.2 −2.2 2.6 0.2 1.6 0.2 −0.2 −1.4 A5 3.2 4.0 1.6 2.8 2.8 2.4 1.2 −0.4 1.2 1.8 1.9

(7)

ると図

5

左のグラフが得られる.

サンプル 15を○,×,△,□,*のマークで表 す.

このグラフを見ると,評価者によって評点のつけ方に 違いがあるように見える.

表5中央に示すように,評価者ごとの平均値 を求 める.評点から各評価者の平均値を引いた

*

 =    を計算した結果を表5の下に示す.

*

を縦軸に取ってグラフ化すると図5右のグラフが得 られる.

このような補正を加えた解析はパネルをブロックとす る「乱塊法」と呼ばれる方法である.

「乱塊法」を適用した分散分析表を表6の下に示す.2 つの分散分析表を比較する.

「乱塊法」の残差平方和は「1因子実験」の残差平方 和からパネル間の平方和を引いたものである.

「乱塊法」の残差平方和は小さくなったので,サンプ ル間のF比の値は大きくなり,p値は小さくなった.

これから,評価者で評点の平均に差があるとき,「乱 塊法」のほうが誤差が小さくなり検出力が高くなること がわかる.

2.  データの基準化

図5右のグラフを見ると,平均の違いは補正されてい るが,評価者によって評点の変化の範囲(標準偏差)に 違いがあるように見える.

会議で,議案に対する賛否を問うのに,挙手を求める のであれば評決に対する寄与度は全員同じである.しか し,ここで拍手を求め,騒音計で拍手の音量を計測して 賛否を決めると,激しく拍手する人と静かに拍手する人 で結果に対する寄与度に大きな違いが生じる.

評点の場合も同様で,0点から10点までをつける人 と,3点から7点の範囲で点をつける人では寄与度が異 なる.この範囲の違いが,評価者の評価能力の違いであ れば問題ないが,評価者の性格の差によるものであれ ば,困ったことである.

そこで,平均値を0に揃えるだけでなく,標準偏差も 一定に揃えることにすれば,この問題を解決することが できる.

そこで,表5の中央に示すように,各評価者の標準偏 差 を求めて,

**

 = 

*

/ を計算する.

このようにして求めた

**

縦軸に取ってグラフ化する と図

6

左が得られる.

評価者の変化範囲がほぼ等しくなり,評価者によって 各サンプルの評価が異なる様子が何となく見える.

図5評点データのグラフ化

10 9 8 7 6 5 4 3 2 1 0

4.0 3.0 2.0 1.0 0.0

−1.0

−2.0

−3.0

−4.0 P1

A1 A2 A3 A4 A5 A1 A2 A3 A4 A5

P2 P3 P4 P5 P6 P7 P8 P9 P10 P1 P2 P3 P4 P5 P6 P7 P8 P9 P10

図6基準化したデータのグラフ

1.5 1.0 0.5 0.0

−0.5

−1.0

−1.5

1.5 1.0 0.5 0.0

−0.5

−1.0

−1.5 P1

A1 A2 A3 A4 A5 A1 A2 A3 A4 A5

P2 P3 P4 P5 P6 P7 P8 P9 P10 P6 P5 P3 P1 P4 P2 P10 P7 P9 P8

(8)

太線の 34は評価者によって評価が分かれるよう である.また,パネル8はほかのパネルとは異なるよう である.

これらの点についての検討には,次節で説明する「主 成分分析」が有効である.

3.  主成分分析

一般の消費者をパネルとした場合,評価者によって評 価基準が異なる場合が少なくない.評価者の属性(性 別,年齢,出身地,など)が調査されている場合は,そ れらの属性と評価値との関係を重回帰分析で調べると,

興味ある関係が明らかになる場合がある.

逆に,評価値から評価者を分類することも考えられ る.そのときに用いられるのは主成分分析である.

表5のデータ(変数の個数(列数)が10で,サンプル の個数(行数)が5)に対して主成分分析を適用する.

通常の主成分分析(正確には,相関係数行列を出発点 とする主成分分析)では,データ を前節で説明した 基準化した値

**

に変換して解析をしている.

表5のデータに主成分分析を適用した結果の一部を図

7

に示す.

図7下のグラフは因子負荷量で,評価者 の特徴を表す.

8 (ク)はほかの評価者とは評価が全く異なることが わかる.

右上の 9710(ケ,キ,コ)の3人は,右の6人 とは評価が異なる.

図6右のグラフは,パネルの順序を図7の因子負荷量 のグラフでのパネルのプロット点の右下から反時計回り 並べ直したものである.

左のグラフと比べると,パネルによる評価の違いが明 確にわかるであろう.

図7の上のグラフは主成分得点で,サンプル がどの ように評価されたかを表す.左からサンプル番号と評点 の平均を調べると次のようになる.

サンプル 4 2 3 1 5

評点平均 4.6 5.4 6.0 6.5 7.9

右は評価の高いサンプル,左は低いサンプルに対応す る.これから,第1主成分は評価値の平均的な値を表す 成分と考えられる.

上下に離れている  453は評価者によって評価の 異なるサンプルである.図6右のグラフで折れ線が斜め に引かれているサンプルである.

この解析は,筆者の開発したExcelVBAによるマク ロを使った.マクロは学会からダウンロードできる Excelファイルに含まれ,使い方の説明も書かれてい る.

主成分分析のプログラムは,ほかにもたくさん公開さ れている.しかし,主成分分析の裏には,たくさんの前 提や仮定が含まれ,機械的に適用することは極めて危険 である.

たとえば,主成分分析は変数間の相関係数行列を出発 点とする場合が多い.相関係数は変数間の直線関係の強 さを表す数値である.変数間に曲線関係があるときは,

適当な変数変換をして直線関係に近づけるなどの予備処 理が必要である.主成分分析を適用するに先立った,上 に挙げたようなグラフだけでなく,各変数のヒストグラ ム,すべての変数間の散布図行列を作成して観察するべ きである.

十分に勉強してから利用して,誤用を避けていただき たい.

おわりに

ページ数の制限のため,説明の不十分な箇所が多かっ たと思う.Excelファイルの計算過程を追うことで,不 備を補って欲しい.

1.632 1.360 1.088 0.816 0.544 0.272 0.000

−0.272

−0.544

−0.816

−1.088

−1.360

−1.632

−1.632

1.000 0.833 0.677 0.500 0.333 0.167 0.000

−0.167

−0.333

−0.500

−0.667

−0.833

−1.000

−1.000 z2

z1

z1 z2

1.632

1.000 P1 P2P3 P4 P5 P6P7 P8 P10P9

ア イ ウ エ オ カ キ ク ケ コ A1 A2 A3A4 A5

ア イ ウ エ オ 主成分得点

因子負荷量 エ

イ ア

エ イ

ア オ

ウ カ キ

ケ コ

図7主成分分析の結果

(9)

筆者が目にする統計解析の誤用のごく一部を取り上げ たに過ぎない.官能評価を業務に活用されている方々 は,ぜひ統計解析の基本を勉強して,得られた実験デー タからできるだけたくさんの情報を取り出して欲しい.

プロフィル

芳賀 敏郎(Toshiro HAGA)    

<略歴>1951年東京大学理学部化学科卒 業/1951年山陽パルプ株式会社/1979年 慶応義塾大学医学部/1984年東京理科大 学工学部/1997年同大学定年退職<研究 テーマと抱負>現場で役立つ統計解析技 術.実務家からの問題提起に応えて,一緒 に考えること

Referensi

Dokumen terkait

問題解決のための新技術 つづき ►透明な PLA フィラメントをつかえば,1 重であることを長 所にかえて光輝く美的な印刷が実現できる. ►ヘリカルな印刷には従来の 3D CAD がつかえないので,か わりに Python 言語のライブラリを開発し提案している. ■ この方法では設計者がプログラミングのスキルをもつ必要がある. ►アイデアの権利化