Online Argonauta
<< Back to Index

Argonauta 2: 21-32

'Pseudoreplication' problem‐接着したコドラートは何が悪いのか



大垣俊一

 私たちが海岸生物の調査を行う場合、かつてであればトランセクト法によるのが普通だったし、今ならコドラートを使うのが一般的である。後者のバリエーションとして、一定範囲を格子状に切って一つ一つ見ていくというやり方があるが、そういった接着したコドラート配置は誤りであるという主張が欧米において現れた。1980年代半ばのHurlbert (1984)の論文である。

 この論文はコドラートの配置の問題だけでなく、生態学における実験デザインと統計処理の問題を幅広く論じたものだが、当初はそれほど大きな影響を持ったようには見えない。私なども、当時潮間帯の論文でこれが引用されるのを見たことはなかったし、むろん調査遂行上の必読文献とも思っていなかった。80年代にはまだ、この論文がずさんであると批判したたぐいの実験手法による種間関係論などが、活発に行われていた。しかし90年代に入り、とりわけA J Underwoodらによる調査方法論の議論が前面に出てくるようになって以降、Hurlbert(1984)の影響は、その 'pseudoreplication' の造語と共に欧米の海岸生態学に浸透し始めた。現在では日本人研究者も、欧米誌に論文を投稿しようとする限り、実験計画や統計処理について論じたこの論文を無視することはできにくい状況にある。

 そこでここでは、このHurlbert(1984)を紹介しながら実験計画の問題について論じ、同時に欧米の海岸生態学の現状についても若干の考察を行いたい。なお、'pseudoreplication' という用語は「ニセのレプリケート」とでも訳せ、「レプリケートを取ったつもりでいながら実はそうなっていない」という、否定的な価値観を含んだ言葉である。この言葉を用いることは、ともすれば研究者本人がレプリケートのつもりでやっていないにもかかわらず、相手を無理に自らの土俵に乗せて批判するのに利用される可能性がある。私は接着したコドラートが常に誤りであるとは考えていないので、この言葉はHurlbert(1984)からの引用としてのみ引用符付きで用い、特定のコドラート配置を指す一般名詞としては用いない。なお、この一文は2000年1月23日、京都におけるArgonauta例会での表題と同名の発表に基づき、その内容を文章化したものである。

Hurlbert (1984)の論旨

コドラート配置の問題は広く生態学一般に共通することであり、この論文の視野も、分野を問わず幅広い。しかし中でも、潮間帯で行われている実験のデザインを批判することに相当の力点があることは否めない。Hurlbertは、学生実習を利用して生態学関連の文献リサーチを行い、彼のいわゆる‘実験的研究’のうちで、'pseudoreplication'の誤りを犯した例がmarine benthosとsmall mammalsの分野で特に高かったと述べている。推測統計(サンプリングによる母集団推定)を用いたものでは全体で48%、marine benthosでは62%で最大であった。小型哺乳類については調査遂行上の困難さがあると弁護しているが、一方のmarine benthosに対しては辛らつである。'marine benthologists seem the worst pseudoreplicators' と述べ、かつmarineでは一般に、論文中での研究デザインについての説明があいまいであると批判している。

 では、'pseudoreplication' とは何か。この論文には次のように書かれている。

'Pseudoreplication is defined as the use of inferential statistics to test for treatment effects with data from experiments where either treatments are not replicated or replicates are not statistically independent.'

「処理がreplicate(同じ処理をしたコドラートを複数設置すること)になっていないか、replicateが統計的に独立でない実験から得られたデータを用いて、処理の影響を検定するために推測統計を用いること」とでも訳せるだろう。単純化して言えば、実験区1つと処理区1つで比較するという場合で、これはpseudo-というよりはno replicationと言うべきだが、これ以外に、一見いくつかあるように見えるが、実質的に1つとみなされる場合を一般的に 'pseudoreplication'と定義している。なお、Hurlbertの 'experiment(実験)' とか 'treatment(処理)'という用語は、我々の常識的理解とは少しずれがある。彼は人為的に手を加えた場合だけでなく、異なる条件の2地点を比較するような場合も「実験」であるとし、前者をmanipulative experiment(操作的実験)、後者をmensurative experiment(測定的実験)と呼んで共に「実験」の概念に含める。mensurativeの場合には、場所の違いが「処理」に相当すると考えている。

 では、「一見replicateを取ったように見えるが、実はそうなっていない」というのはどういう状態を指すのか。Hurlbertは、mensurative experimentの場合について、次のような実例を示す。湖の1m水深での木の葉の分解速度を調べるために、8つの袋をひとくくりにして同じ場所に沈めれば 'pseudoreplication'となる。つまり、この場合に測定されるのは1m深の分解速度ではなく、1m深には違いないが、ある特定の1点での分解速度にすぎない。1m深と8m深に8つずつの袋を沈める場合も同様で、それぞれをくくって1点ずつ2点に沈めれば、これもそれら2地点を代表する値にすぎなくなる。つまり、仮説が暗黙に前提としている範囲(ここでは一般的に1m深と8m深)より狭い範囲でサンプリングや測定が行われていることが問題であるとする。manipulative experimentについても実例が挙げられているが、基本的な理屈はこれと同じである。

 次に論旨は実験、とりわけ操作的実験のデザインと統計処理についての注意点へと移り、サンプルのreplication、randomization(コドラート配置の無作為化)、interspersion(処理区とコントロール区の相互散在)などの重要性が指摘される。replicationが必要であることは本論文の前提であり、だからこそpseudo(にせの)-replicationということが問題になるわけである。Hurlbertはその必要性の理由を、分散を用いた検定を可能にするためとしている。またrandomization(ランダムサンプリング)は統計検定の前提である。確かに、1区よりも2区、3区…で同じ結果が出たほうが結果の信頼度は高いだろうし、コドラートを偏った配置にして、特定の結果が出そうなところでのみ調べるのがまずいということは常識的に理解される。コドラート配置については、Hurlbertはinterspersionを重視し、それぞれのコドラートグループを、互いに入り乱れるように配置しなければならないとする。これは処理区とコントロール区の場所特性や、突発的な外的条件が発生して結果を乱すことを避けるためである。この論文では下図によって好ましい配置、好ましくない配置が解説されている。なおこの図ではスペースを節約するためか、コドラートの配置が直線的だが、議論は2次元的なイメージで行っている。

図1.コドラート配置の様々な例。Aが好ましい配置、Bは'pseudoreplication'(Hurlbert 1984) 図1



 1は完全なランダム配置で受け入れられるデザインだが、コドラート数が少ない場合には配置が偏る可能性がある。 2は処理区とコントロール区をセットにした上ランダムに配置するやり方で、正しいやり方。3は交互に並んでいてinterspersionを実現しているが、何か周期的に変化する要因に同期する懸念がある。ただしその可能性は小さい。B1-3は処理区とコントロール区がそれぞれかたまって(分離して)おり、場所差が混入していわゆるType I error(差がないのにあると誤認する危険性)が増す。B-4は室内実験の例で、一見intersperseしているが、処理とコントロールのユニット(水槽など)がまとまって維持装置(エアレーションなど)に接続しており(原図では黒どうし、白どうしが線で結ばれている・オンライン版ではa, bで示す)、実質的に分離してしまっている。B-5はレプリケーションがない.

 実は1の配置を論じたところですでに問題になっているのだが、randomizationとinterspersionは時に矛盾する。つまり、ランダムを徹底するなら、乱数表を用いた位置決定などを通じて、たまたま処理区とコントロール区が分離してしまっても、それを受け入れなければならない。しかし実際には、たとえば処理区が全部プール内に落ち、コントロール区がすべて高台の上に乗ったりしたら、そのまま実験に入るのはかなりの心理的抵抗がある。そこで手を加えて多少とも相互散在的に配置を変えたくなるが、しかしそれをするともはやランダムではなくなるのである。この問題は、検定の計算に影響する。たとえば2集団の差をt-検定で調べる場合、使用するt分布はランダムサンプリングを前提にして描かれている。実験から得られたt値をt分布にあてはめてP<0.05の棄却域に入るかどうかを調べるのだが、コドラート配置をいじった段階で、この理論分布が変わる。具体的には図2に示すように、より差が出にくい方へ、中央寄りに集まってくるはずである。したがって、検定はt分布を点線のように補正してから行わなければならない。しかしそれは実質的に不可能なので、一般的なt分布によらざるを得ず、検定結果に狂いを生ずる。

図2.理論的なt分布(実線)と、interspersionによって変形したt分布(点線)。斜線はP<0.05の棄却域。 図2

 Hurlbertによれば、この問題は、生物検定草創期の二人の大家、FisherとGossett(t検定に名を残す 'Student' は後者のペンネーム)の論争にまで遡る大問題であるらしい。Fisherがあくまでランダム性を重視したのに対し、Gossettは配置に手を加えることを容認した.Hurlbertは後者の立場に立ち、P値の不安定性に対しては、interspersionによってrandom性が崩れても、それは、より差が出にくい厳しい条件で実験していることになるので、Type I errorを増加させることにはならない。つまりそれでも有意差が出れば、その結論は有効(いわゆるconservative)と述べている。

 'pseudoreplication' は時間的にも発生しうる。同じ範囲内から時間を違えてくり返しサンプリングをする場合で、Hurlbertはこれを 'temporal pseudoreplication'と呼んだ。問題点はこれまで述べて来たのと同様で、その範囲の場所の条件に影響され、処理の影響を検出しにくくなるという点にある。ただしこれは同じ地点から得られたデータを、ある処理に対するindependent replicatesとみなすのが問題なのであって、そうでなければこのようなデザインも正しい研究手法になりうると注釈している。

 'pseudoreplication' からやや離れ、統計処理上のよくあるまちがいについても議論されている。たとえばデータのpoolingだが、Hurlbertが検討したところpoolingが正当とされる事例はなかったという。その最大の問題は、replicate同士をプールすることによって、replicate間のvarianceの情報が消滅することにある。あらかじめreplicate間で有意差がないことを確認してからプールしている例もあるが、これは的外れで、数が増えるなどして検定精度が高まれば必ず差は出る。むしろその差(variance)を生かした検定を考えなければならない…。この問題はデータをプールした後のχ2検定を実例として解説されているが、Hurlbertはχ2検定そのものに対しても批判的である。つまりχ2検定は、replicateのない2サンプル間の比較に使われることが多く、これを使うということは実験計画そのものの欠陥を示す。処理の影響を検出するためにはreplicateを取った上、分散を生かしてt、u、ANOVAなどの検定を用いるべきであると述べている。ただしこれはmanipulative experimentの場合であって、単に2地点間の場所差を検出する(mensurative experiment)ためならばχ2検定は有効であるとし、すべて否定しているわけではない。

 生態学の論文中の図で、平均値の上下によくSD、SE、95%信頼限界などが表示される(いわゆる箱ヒゲ図)。この上下の幅として何を採用すべきかということにも、Hurlbertは注意を促している。SEや95%信頼限界は、母集団平均値の推定範囲をイメージしており、2つの平均値のまわりにこの範囲が示されていた場合は、SEであればそれを互いに約2倍して、95%信頼限界ならそのままで見て、相互に重なっていなければP<0.05で母集団平均値に差がある、という判断を含意している。しかしもし、基になったデータがrandom samplingや正しいreplicateという統計学上の要請を満たしていないなら、たとえはっきり母集団の有意差に言及していなくとも、SEや95%信頼限界の表示は紛らわしく、混乱のもとである。このような場合は実験計画に問題があることを述べた上、ばらつきを示すにはSDを用い、またサンプル数のnを付けておけばよいとしている。

 以上がHurlbert(1984)の理論的部分の要約だが、最後に著者は、統計学者と雑誌のeditorに対して提言を行っている。editorは唯一、論文採用の決定権を持った存在であるとし、

'Poorly designed or incorrectly analyzed experimental work literally is flooding the ecological literature.… nothing educates so well as an editorial rejection or request of major revision.'

誤ったデザインの研究があふれている(特に潮間帯?)ので、研究者を教育するために編集者はどんどんrejectせよ、と言っている。それまでの純理論的な記述から一転し、学術論文としてはやや異例の現実的かつ刺激的な記述で、24ページにわたるやや長めの論文は終わる。

Hurlbert(1984)以降の潮間帯生態学

 以上に紹介したHurlbert(1984)の論文は、冒頭述べたように、1990年代に至って欧米の潮間帯生態学に影響を及ぼし始めたようである。たとえば最近和訳が出版されたRaffaelli & Hawkins(1996)は、初学者から専門家を対象とする潮間帯生態学のテキストだが、潮間帯調査の方法論の項においてHurlbert(1984)が引用され、記述内容に対する影響も大きい。操作的実験のコドラート配置について説明した図(和訳本下巻p138)は、先に紹介したHurlbertの図(本稿図1)の、平面上への焼き直しと言ってよい。またUnderwood(1997)の 'Experiments in Ecology' では、nested-ANOVAの項(p245-6)で、1セクション設けてHurlbertの 'pseudoreplication'の概念を紹介し、実験のデザインと解釈の誤りについて認識を深めるために、Hurlbert(1984)を一読するように強く勧めている。Underwoodが示すnested-ANOVAにおける良好なコドラート配置の例は、Hurlbert(1984)のinterspersionの忠実な再現であるし、manipulative、mensurative experimentなどの用語もHurlbertを踏襲している。

 ここで私自身の経験から、欧米研究者の調査計画観とHurlbert(1984)の影響について触れたい。具体例として、白浜番所崎での海岸貝類相調査をあげる。

 図3.番所崎貝類相調査のデザイン。4416m2の岩盤を69の格子区画に分割した。Ohgaki et al. (1999)による。
図3

 私たちは図に示すように、潮間帯の岩礁約4500・の範囲を格子に仕切って8m×8mの調査区を69設定した。ここで年1回、各区内ですべての貝類種を探索し、その存否を記録した。種ごとに分布状態を描き、その経年変化を追跡して、貝種全体の変動傾向を探ろうというものである。このようなデザインを採用した理由は単純である。図に示すように、調査域は大まかには平坦な岩盤であるが、海岸環境の常で、細かく見れば起伏があり、プールが散在し、ノッチやクレビスもあるといった具合で、それらに応じて出現する貝類種をできるだけ多く発見し、詳しい分布を描くためには岩盤全体を調べることが必要と判断した。ランダムなコドラート配置というようなことも考えないではなかったが、それでは一部しか見られず、パッチ状の分布が少しずれるだけで結果に大きな影響が出かねない。そもそも、一部しか見ないより、全体を見たほうが実り多いことは自明であろう。ところが結果を論文にして海外誌に投稿したところ、方法論について以下のように散々なコメントが付いて返って来た。

Reviewer 1. It is pseudoreplicated, with only one site studied; the quadrats were not randomly selected; all the quadrats were contiguous and cover the whole of the study area.
Reviewer 2. Results is weak due to statistical analysis. These are much more powerful tools and the author should use them. … It still have problems with the fact that only one site was examined. Their conclusions would have been so much more powerful if they had spread the same effort over, say, three sites. It just seems such a bad planning.
Reviewer 3. There is no doubt that the sample design is poor and not in keeping with modern approaches. Using only one site with pseudoreplication should not be done today.… Underwood's new book and Hurlbert's paper on pseudoreplication must be cited.

 1は前号の「Underwood書評」でも紹介したが、まさに今回のテーマに添った内容なので再掲した。実験デザインがpseudoreplicationであってランダムでないから誤りであると簡潔に述べている。2は本研究がランダムサンプリングの欠陥を補うために広範囲の面積をカバーしたことを理解せず、そのため「1ヶ所」になったことを逆手に取って、さらに別のコドラートを設け、統計検定を使うよう要求している。3は、コドラートが接着していることをもって 'pseudoreplication' とみなし、やってはならない時代遅れの方法と断じている。Hurlbertの影響が色濃いことは言うまでもない。

 私はこれらのコメントを見たとき、reviewerたちがなぜくり返しこのように言ってくるのかを理解しかねた。すべて見てはならず、一部に止めて統計を使わなければ時代遅れでまちがった手法であるという考え方は、どこから来るのか。しかも2と3のreviewerは、別のところで貝類全種10年のデータの豊富さを認め、温度上昇に伴う南方性種の増加という結果についても 'convincing' と、高く評価しているのである。方法がおかしいから結果も信用できないと言うのかと思うと、そうでもない。

 Hurlbert(1984)とUnderwood(1997)を読んだ今では、私はなぜこういったねじれた議論が欧米の海岸生態学を席巻するようになったのか、その間の事情をある程度理解できる。次節では再びHurlbertの原論文に戻ってpseudoreplicationの問題を再検討し、海岸調査のあり方について若干のコメントを加えたい。

Hurlbert(1984)の批判的検討

接着したコドラートは何が悪いのか

 'pseudoreplication' 批判の要点は、つまるところ「1地点で調べたに過ぎなくなる」ということである。1地点では場所の影響が排除できなくなり、varianceを用いた統計が使えない。いわゆる 'manipulative experiment'(操作的実験)の場合は、replicateを取ったうえ処理区とコントロール区をintersperseさせれば、この問題は解決しそうに見える(実は後述するように簡単ではない)。しかし 'mensurative experiment'(比較)の場合、「1ヶ所」と「1ヶ所でない」という区別は何によって決まるのか。私がはじめに抱いた素朴な疑問は、「接着していて悪いなら10cmでも離せば1ヶ所でなくなるのか」ということだった。Hurlbertは湖に8つの袋を沈める例でpseudoreplicationを説明したが、では1m深に沈めた8つの袋をどのくらい離せばよいのかという問題が残る。10×10m範囲内に散在させても「1m深」を代表させられるわけではなく、それはその100・ 内1ヶ所にすぎない。どこまで広げても同じである。「1m深の分解速度」などという、初めから測定不能なものを目的として持ち出せば、あらゆる調査デザインに対して 'pseudoreplication' の批判が可能になるだろう。この間の事情を下図に模式的に示した。

図4
図4.random samplingと 'pseudoreplication'

 つまり、A図左下のようにメッシュを切って詳しく見た研究があると、'pseudo-replication' であるとして、点線の位置に別のコドラートを設定するように求める。しかし実は新たに設定された3つのコドラートは、右図Bの視点からすると、これまた1ヶ所の範囲内に収まるものにすぎない。しかもこの場合、1ヶ所であるばかりか、1ヶ所の中を不十分に見たにすぎないという欠陥が加わる。確かに信頼限界は計算できるが、それはBの点線範囲内を推定するのに役立つにすぎず、その外枠を越えて周辺に無限に拡張し得るものではない。このように、Aの視点でBを批判することもできれば、Bの側からAを批判することもできる。結局、調査者がどの範囲の状態を明らかにしようとしているかを無視した議論はナンセンスなのである。ここの所、Hurlbertは「想定された範囲に対して小さすぎる時にpseudoreplicationが発生する」と慎重に言い回しているが、それは逆に言えば、「想定する範囲」をはっきりさせておけば、'pseudoreplication' にはならないということである。しかし後の欧米研究者たちはそのように考えなかったようだ。範囲を明示しているにもかかわらず、コドラートが接着していれば即誤りと断じ、遅れた手法のレッテルを張るに至った。'pseudoreplication' の概念が、慎重な原著者の手を離れて一人歩きを始めたのである。

 ‘一人歩き’のもう1つの例が、'temporal pseudoreplication'の概念に見られる。Raffaelli & Hawkins(1996)は、海岸での長期モニタリング調査の注意点について次のように述べる。「ある決まった場所での観察というアプローチは、統計的な解析に関しては問題がある。というのは、くり返して行われる観察が、お互いに独立であるとは言えない事が明らかだからである。したがって、他の場所との比較は実質的に不可能である。(下巻p135)」理解に苦しむ一文である。時間変化は、場所を固定して調べなければ意味がない。他の場所と比較できないとはどういうことだろうか。A点とB点で結果がちがえば、事実としてちがうのであって「比較できない」などということはあり得ない。この記述は先に述べたように信頼限界の捉え方をはきちがえているのだと考えられる。くり返しになるが、信頼限界を計算してもそれはA区とB区の内部を推定しているにすぎず、本質的な問題は何も変わっていない。Hurlbert自身は 'temporal pseudoreplication' をmanipulative experimentに限定して解説し、mensurative experimentにおいては妥当な場合のあることを述べている。しかしRaffaelli & Hawkinsは、同じ範囲内から時間を違えてサンプリングすればすなわち誤りとみなし、無理な理屈をつけて批判しているように見える。

 ところで、1ヶ所にすぎないと再三言われているが、それは本当だろうか。さきほど私は図4Bも1ヶ所だと言ったが、それは彼らの論法に従えばそうなるということであって、実際にそのように信じているわけではない。たとえば、白浜番所崎の調査区内で南方性種の割合が年々増加していることは、経験的に言っても田辺湾周辺で起こっていることの反映であって、調査区のすぐとなりでは逆のことが起こっているなどということはほとんど考えられない。同様に、ある地点である種の生態を調べたという報告があれば、読者はその性質は何らかの意味でその種の一般的傾向を反映すると見るのであって、その地点のそのコドラートの中でしか成り立たないという見方は普通しない。そのようなことを言っていたのでは、一般化は永遠に不可能である。

interspersionは実現可能か

 処理区とコントロール区をともに設ける操作的実験において、interspersionの考え方はすっかり定着しているように見える。私はこれに理屈上納得しながら、一方で何か単純化しすぎた議論のような気がして違和感を持っていた。それはいわばフィールドを想定した現場感覚的なものである。まずinterspersionについておさらいしてみる。

 図5はHurlbert(1984)、Raffaelli & Hawkins(1996)、Underwood(1997)にも登場するたぐいの、segregated (= clumped、左)とinterspersion(右)のコドラート配置例である。両者を比較して、常に左より右が良いと断定できるだろうか。

図5
図5.処理区(■)とコントロール区(□)の配置。左は分離した(segregated or clumped)デザイン。右はinterspersion。

 背景が真っ白だとなんとなく、左の配置では‘何らかの要因’が処理区とコントロール区で分離しそうに思われるのだが、実は背景は「真っ白」ではない。実際の海岸の状態を仮想的に補って、下のように重ねてみた。

図6
図6.図5のコドラート配置に、仮想的な海岸の状態を重ねた。下表は処理区とコントロール区が、様々な環境勾配に対してどのように分離しているかを示している。

 海岸のこの範囲には、高い岩盤と低い岩盤が混在し、低いところにプールがあって、その周辺に海藻が生えている。コドラートのいくつかはクレビスを噛んでいる。処理区とコントロール区を妥当に配置するということは、これらの条件を相互に一様にすることだが、実際には下表のように、図5でintersperseしている右側のデザインの方が、かえってこれらの環境勾配に対する偏りが大きい。もちろんこの図は、こういう結果になるように仕組んで描いたのだが、現実にもあり得るパターンである。いずれにせよ複雑な海岸環境にあっては、この程度の数のコドラートでは机上で設定したinterspersionの配置などほとんど役に立たないことを、経験を積んだフィールドワーカーならば理解するだろう。

 考えてみれば、生物統計学の創始者であるFisher、Gossettらは農業試験場の技師であり、Hurlbertはlimnologyの専門家である。農場や湖の中が、海岸より一様な環境であることは論を待たない。そこではこ背景を一応「真っ白」としてもよいのかもしれない。しかし海岸、とりわけ岩礁潮間帯は複雑である。岩盤の高低、岩質、基盤の傾き、クレビス、波当りの差、日射量、プール、海藻の被度と種類、肉食性種等の他種分布…。実験結果に影響を与えそうな要因が数多く、しかも目に見えている。それでもなおinterspersionを言うなら、それはもはや平面上での配置の問題ではなく、あらゆる環境条件をinputした多次元(多要因)空間を想定し、その中での相互散在に帰着するだろう。デザインは複雑化し、コドラート数の増加と使用範囲の拡大は必至である。このことは、農場や湖中のような、はるかに一様な環境にくらべ、同じ精度の結果を得るのにより多くのエネルギーを要することを意味している。Hurlbertは哺乳類分野でのずさんさを弁護してmarine benthologistをやり玉に上げたが、潮間帯のフィールドに対する配慮が欠けていたようだ。潮間帯生態学者も実験計画に無関心ではなかったはずだが、現場の複雑さから、少しくらいコドラートの配置をいじっても解決にならないことを実感していたがゆえに、結果的に他分野から見れば「いいかげん」なデザインで妥協していたというのが実態であったと思われる。

統計使用の前提化

 'pseudoreplication' 批判の根拠の1つは、varianceを用いた検定ができなくなるということであった。これは裏を返せば、統計の使用を生態学研究の前提条件と考えていることを意味する。Hurlbert(1984)では、replicateがなくても結果が説得力を持つ場合があるとしているが、例は流域の樹木を皆伐したり、湖全体が富栄養化した時の変化など広大な面積を対象としたものである。条件はかなり厳しく、それだけランダムサンプリング‐推測統計へのこだわりは強いとみられる。それでもHurlbertの場合は、誤った統計処理でもやった方が、統計を使わないよりも受け入れられやすいようだと現状に対する皮肉を述べ、雑誌のeditorに対して、推測統計の使用を抑制した良い研究例を積極的に受理するよう求めている。しかし統計を使わない、あるいは制限的に用いることを認める主張は、後のRaffaelli & Hawkins(1996)やUnderwood(1997)では影を潜める。後者の場合はなぜ統計が必要かを力説するのみで、方法論を記した大部の教科書の中に、統計を使わずにやる方法もあるという主張は一行も見られない。

 推測統計は、限られた労力で全体の状態を信頼限界付きで表示するためのエレガントな手法であって、使用局面によっては大きな威力を発揮する。海岸の例でいうと、石灰藻のマットがあって、その中のメイオフォーナを調べるような時、マット全体を見るのは事実上不可能だから、ランダムサンプリングによる推測統計の使用が適合するだろう。しかし一方、表在性の種類など、分布状態を調べ上げることが可能な場合もある。基本的に推測統計は、すべて見ることができない時の代替手段なのであり、もちろんそれが唯一の方法ではない。それを必須の前提と考えるところから、すべて見てしまうと統計が使えなくなるからだめ、というようなナンセンスな主張が生まれてくる。そのことはまた、図4において彼らが常に左図Aの視点に固執する背景でもある。それにしてもなぜ、欧米研究者はそれほどまでに「統計が好き」なのだろうか。私などの感覚からすると、統計は複雑であり理解に時間もかかるので、できれば避けて通りたい。しかし彼らはそう考えないようだ。これは彼我の文化的相違もからんでいそうな面白いテーマだが、ここでの論題ではないので踏み込まない。ただ一つ憶測すると、「むずかしくてとっつきにくい」ということが、かえって魅力なのかもしれない。


 Hurlbertに始まる実験デザインと統計使用の厳密化の主張が欧米の海岸生態学に与えた影響は、Raffaelli & Hawkins(1996)の教科書の記述の中によく読み取ることができる。潮間帯研究の方法論の項から、一部を抜粋する(下巻p137-141)。

「実験区とコントロール区に見られる違いは、実験操作によるよりも、それぞれの区画が海岸の異なる場所にあるためである可能性もある。そのため、実験区とコントロール区は、十分な数のレプリケイトを取らなければならない。」

 すでにおなじみの、replicateとpseudoreplicationの主張である。数を多く取ること、また実験区とコントロール区を互いにintersperseさせるべきことも、別のところで述べられている。

「実験区とコントロール区が一連の隣り合った区画からなる場合 … 実験のある区画で起こったことが、となりの区画で起こることに影響を与えるかもしれない。もし実験区とコントロール区が非常に離れている場合には、こうした問題は起きない。」

 数を多く取るが、コドラートを接近させてはならないという。すると当然、使用面積は拡大するはずだが…

「しかしだからといって、実験を異なる潮位や異なる波当りの強さを含むほどに広い面積で行うべきではない。」

 面積を広げてはいけないらしい。ではどうすればよいのか。

「しかし現実には、そのようなくり返しの実験を行うのが不可能な場合もまた多い。」

 ここには、自らの組み上げた統計検定と実験理論のため、自家撞着に陥って呻吟する欧米研究者の姿が垣間見える。

 ランダムサンプリング‐推測統計の金科玉条は、しかしながら科学のどの分野でも成り立っているわけではなく、また技術的進歩によって不用となる例もある。近年発達してきたリモートセンシングによるSST画像の解析などはその典型であろう。かつて南日本沿岸の黒潮の流況などは、各県水試や国の研究機関が調査船によって毎月記録した定点水温データを集計して分析していたが、調査時期がずれたり調査点が偏ったりしてあいまいな部分は避けられなかった。しかし今や衛星が撮影したカラー写真によって、日々変化する海面温度が一挙に面的に捉えられる現状である。限られた不完全なデータから全体を推定するための複雑な数式や、ランダムサンプリングを実現するための「権威学者の叱咤激励」は、ここでは無用の長物になりつつある。

 今回紹介した 'pseudoreplication' 批判や、前回紹介したUnderwood流の厳密な実験計画という風潮は、日本のbenthologyにおいてはまだはっきりと現れてきてはいない。今回具体例とした、番所崎貝類相調査にしても、欧米研究者の評価は個人間でも個人内でも二つに割れるが、日本では方法論上の否定的な意見は聞いたことがない。本稿では接着したコドラートがそれ自体必ずしも誤りではないことを述べたが、コドラート法以前にポピュラーな手法だったトランセクト法にしても、見直す余地はある。わずか1mずれれば記録される生物ががらりと変わる可能性があることは確かにこの手法の弱点だが、同一範囲内に数多く設けるなどすれば、対象種の性質によっては有効な現場記述法になると考えられる。 'pseudoreplication' だからだめだとか、トランセクトはもう古いとか、流行や、調査デザインを一瞥しただけの表面的な評価に惑わされず、どういう目的に対していかなる方法が適合するか、個々の事例に即し、基本に返って吟味することが必要である。

 日本のmarine benthologyは欧米の方法論の現状を鵜呑みにすることなく、これに批判的な検討を加えながら、バランスの取れた発展を目指すべきだと考える。私が前回の「Underwood書評」に引き続き、いささかの労力を費やして本稿を提示する意図もそこにある。いずれは欧米においても、現在のANOVA一辺倒の過剰厳密主義に対する反動が来て、最終的には「もう少し精密にやりましょう」という程度のところに落ち着くのかもしれない。しかし仮にそうなるにしても、まだしばらくは過渡期の混乱状態が続きそうだ。いずれにせよどういう調査デザインが正しいかは、それぞれが信ずるやり方に従って収める成果いかんにかかっている。結局最後のところは理屈ではなく、出すべきものを出したほうが生き残るということである。

引用文献

Hurlbert S H (1984) Pseudoreplication and the design of ecological field
experiments. Ecological Monographs 54: 187-211.
大垣俊一(1999) 書評 'Experiments in Ecology' Argonauta 1: 9-14.
Ohgaki S, Takenouchi T, Hashimoto T & Nakai K(1999) Year-to-year changes in the
rocky-shore malacofauna of Bansho Cape, central Japan: rising temperature and
increasing abundance of southern species. Benthos Research 54: 47-58.
Underwood A J(1997) Experiments in Ecology. Cambridge University Press.
Raffaelli D & Hawkins S(1996) Intertidal Ecology. Chapman & Hall.(和訳「潮間帯の生態学」朝倉彰訳、文一総合出版、1999)

Online Argonauta
<< Back to Index
(C) Kansai Marine Biological Seminar Series. All rights reserved.