コントローラー委員会創立の理念と20年の活動

佐藤倚男(コントローラー委員会代表)


1.序言

この文章は1992年7月24日に,コントローラ一委員会創立20周年記念講演で話した内容を,ほぼ再現したものである.しかし講演のあとに,各国の専門家から興味をもたれ,またデータの提供申込があり,他方,国内でもあらためて議論がおこったり,数千例のデータの再分析も行われはじめた.そのために講演記録の印刷にあたっては,とくにつぎの3点の説明について筆を加えた.これらは日本独特という人もいるが,私やコントローラー委員会としては,各国にもすすめたい3点である.その第1は薬効分野における第3者機関とダブルコントローラー制や,コンピュータの活用の仕方である.このような社会的システムは,まだ世界にlつしかないかも知れない.しかしこのシステムは,利害の錯綜する医療・医薬品の各分野が,相互に信頼できるように工夫した一種の社会的発明ということができる.すでに日本では20年をこえて運用され,技術的,操作的にはほぼ完成の域にあり,このシステムによる薬効研究の公正維持能力は,内外に評価・信頼されているとみる.第2は有効性と安全性の情報を別々に集計するにとどまらず,さらに個別の患者ごとに,その人への効果などと副作用などを総合した「有用性」を判定することである.その患者にとって良かったか,悪かったか,ふたたび使うか,もう使わないかという最終判定をして,その集計を比較検定する.こうすることこそ発売されてからの医師・患者の処方・受療行動を予測することになる.第3は,データの統計処理には原則として,ノンパラメトリック統計を用いる.その理由は,医師にわかりやすく,データをその情報水準に合わせる時に無理がなく,代表値や集計法,統計検定法でも仮定が少ない.このような特性から,医学,薬学分野の研究者が,統計学的議論に引きずりこまれにくいという利点がある.


2.第3者制

1965年,昭和40年に,私は中央薬事審議会の新薬調査会委員になり毎週1回午後出席した.ところがここでは「二重盲検法による科学的な臨床報告でなければ評価できない」という批判が毎回出されていて,それに対して事務局側からは「指導できる医師はもちろん,やったことのある医師もいないのに,役人からそういう指示は出せない」という反論が繰り返されていた.臨床へのこの批判は薬学系の委員からのものである.この要求には臨床医学の水準向上と,非医学系分野の者でも信用できる薬効評価を出して欲しいという2つの気持ちが込められていたと考えられる.ただし日本でそれまでに二重盲検法による評価をした新薬がまったく無かったのではない.二重盲験法は1950年ごろ米国で,個人心理と社会心理への洞察をもとに,真実の追求の時の意識的作為だけでなく無意識的な偏りすら取り除こうとして,臨床医学の分野で工夫された画期的な方法である.これは無作為化比較試験および統計的検定と一体になって,はじめて真実をわれわれに知らせてくれる方法である.これを実施するときもっとも肝腎なことは,第3者による厳密な盲検工作である.そのあとブラインドのままでデータ収集を行い検定をしなければならない.アト知恵による訂正や,症例の不採用などで,結果を意図的に変えることが手続き的にも不可能であれば,審査する委員たちも承認する行政側も,さらに何にもまして臨床医や患者全部の信頼が得られる.


3.コントローラー委員会による二重盲検法の維持と保障(Fig‐1参照)

かくてコントローラー委員会の第3者機関としての具体的な仕事は,くわしくはFig‐1のフローチャートにあるが,前臨床,先行Phaseのデータの検討,計画,症例記入用紙の決定,試験薬,対照薬,それらの包装を含めた識別性の検討をすませる.委員会の一定の広さの部屋に,運び込まれた数百錠入りの患者一人分の箱または瓶の対象患者分にランダムに番号をつける.コントローラーは,錠剤,カプセル,包装類が,試験薬と対照薬とで識別されないように準備されているかどうかを,割付前に点検し,無作為に箱を抜き取って,各有効成分の定量などを中立機関に検査依頼する.この箱が参加した各病院に送られ,医師は番号の若い箱から順に患者に割付けて使う.アト知恵による訂正,補充を防ぐため,症例デ一夕をすべて委員会のコンピュータに入れ,それをいったんプリントに打ち出して誤字,脱字,不合理な箇所を訂正し,それでもまだ記載事実に疑問があるときには臨床医を代表する中央委員会が検討したあと,全員の承認を得てデータを固定する.企業,医師たちの会合の席で,コントローラ一がブラインドの鍵を開きキーコードをコンピュ一夕に打ち込む.あとはプログラム通り,全症例が一挙に試験薬群,対照薬群に分けられ,集計され,有意差検定などが行われる.2時間ぐらいの会議中にその結果が出てくる.この「全体会議方式」は,手続きと経過が全員に公開されている上に,処理が早く,公平である.しかしこの方式は早く仕事がかたずいて良い代わりに,企業の担当者にとってはスリルがありすぎるようで,そのうえ新薬が対照薬やプラセボに負けた結果が打ち出されたりすると,それからあとの検討会や食事は,お葬式やお通夜のように落ちこんでしまう.そのためもあってかこの明快でごまかせない方式はその後中断されて,まず主な医師達からなる世話人会とか中央委員会が企業とともに,コントローラー委員会から持ってゆく打ち出された結果を吟味して,その後解かりやすくレイアウトし整理してから,全体会議に報告する「2段階方式」となっている.この方式では参加した全部の臨床医に対して,中央委員会と企業を信用するよう強要していることになる.


4.ダブルコントローラー制による信頼性維持

コントローラー委員会では,利害関係からの独立性をさらに強化して,データ処理結果を信用してもらうための手段を考案して,20年前からダブルコントローラー制をとっている.原則として企業が希望するか,処理を依頼された委員と,われわれの中の,または時に行政側や中央薬事審議会の調査会からもう一人が,それぞれブラインドをかけてコード化する.2人のキーコードをマッチさせない限り薬物名が明らかにならないことになる.コントローラーを複数にしたきっかけは,私がコントローラーをして,優れた新薬だという検定結果がでたという論文が提出されて,またさらにつけ加えて発言しても,薬によっては,とくに薬理や薬物代謝の面で作用発現に問題があるときには,基礎医学の権威者としては,簡単には賛成はできない.臨床で効くと言われても,その説明を薬理や代謝の面で論理的に構築できないからである.こういうデッドロック状態を技法的に解決するために,お互いにコントローラー1人だけではコードがあかないように,つまり患者ごとに割り当ててある薬剤の内容がわからないように,調査会の別の委員にもコントローラーを引き受けてもらって,再試験することなどが重なった.そのため現在では第V相治験のときは,ダブルコントローラー制でやるようになっている.なお企業があらかじめブラインドをかけて委員会に持ちこむことも可能である.

コントローラーは,Fig.1のように実験計画を点検したうえで,その計画書を対照薬を販売している会社に見せて承諾を取る.公平な比較のためである.また試験薬と対照薬の含有量,崩壊性などの確認検査用の抜き取り,無作為割付,薬剤配布,データ集め,相互連絡,アト知恵防止,集計処理,検定法とその選択,アウトプット形式の決定などを行う.さらに予定されたすべての臨床症例の記録が終わった時にも,(以下部分的に,Fig.1には省略されているが)必要なら,残った薬剤の安定性などの抜き取り検査をする.最後に計算結果を盛り込んだ報告論文が,対照薬を提供した会社との協議がすんで公表されたら,そのデータ照合を行う.なお患者からインフォームドコンセントをとることを当然条件としているが,「プラセボ投与の説明ができない」として,拒否されたことが今までに1回あり,このさい委員会は,このプロジェクトヘの協力を計画書作成の途中の段階で中止した.


5.コントローラー委員会の構成

以上のことから委員会は,二重盲検法が公平,公正に行われるための第3者制の部分の委任事務だけではなく,比較集計された結果が関係者に信用されるための方策にも注意と努力を払っていることがわかる.そしてこのような複雑,精密な手続きとその点検,およびコンピュータの操作は,いかにコントローラーが熟達したとしても個人で,1人ではできない.まじめにきちんとやるつもりならどうしても第3者機関として規定通りに動いてくれる組織が必要になってくる.それがコントローラー委員会という組織が必要になった理由である.自発的な有志としての医師たちの集まりが,自らの事務局を持って,ここに中立の立場で働くべき訓練された事務局員たちを専任の職員として雇うこととなる.

委員会の人的構成は,各科の臨床医が中心で,ここに弁護士,統計学や疫学の専門学者たちが加わっている.さらにここで決まったことをやるのが事務局の妙令の淑女や女傑たちである.なお彼女たちは素人として命令通りに事務をやるだけでなく,すべての決定や仕事のながれについて患者・家族の立場で考えるように,最初に教育されてその役割も期待されている.委員会に属した医師,弁護士,統計・疫学者たちはこの10年,20年の間にそれぞれの分野で権威者として育っていると言えるが,彼女たちもまた劣らず成長して,企業や行政に対してのみならず,内なる委員の行動や微妙な姿勢に対しても,きびしい具体的,専門的批判者となって無視できない存在になっている.

なお最初に話したような日本の許認可行政における,薬学系の委員による臨床医への要望が強かったことを考えると,コントローラー委員会の組織がもっと社会的に認知され安定するならば,薬学者や薬剤師の参加なども求めるべきである.またこれらの治験は,国民全体の健康に重大な影響を与えるので,国として責任が負える体制を作る必要がある.そのさい,またはそれまでは,行政官や中央薬事審議会委員,ことに担当新薬調査会委員が,公正性の確認,納得のため少なくとも第2コントローラーを引き受けることが望ましい.


6.機関誌「臨床評価Clinical Evaluation」

月に1回の委員会の会議では,必要に応じて科学的妥当性,公平性,倫理的許容性などが,提案されているプロトコールごとに,臨床医の学会よりもくわしく自由に議論できる.人体実験の説明と同意の間題は,早くから委員会の機関誌「臨床評価」に載せられている.この機関誌には原則として委員会が関与した治験のすべてが公表され,公正さに疑問が持たれたときにはその旨の追記をしたこともある.

プラセボと差の無かったもの,対照薬より劣っているという結果のために,薬務局への承認申請を中止した場合の結果も公表される.委員会が関与するときには公表が原則である.信頼性の維持と科学的方法論の発展のためである.なお注目すべき副作用に関する報告には原稿料を出している.


7.「全般改善度」(general improvement rating,GIR)

きわめて良くできている米国INDの「論理上第2次大戦の反省から生まれたヘルシンキ宣言の「倫理上盲験操作にみる「心理」的な洞察など基本的,原理的なことで委員会は先進各国と一致している.しかし具体的なデータの扱い方の点で委員会は,「有用性」の判定を最終的に重視することと,正規分布や比例・間隔尺度を前提条件としないですむノンパラメトリック統計を採用することの,2つの点で特徴があると考えている.

まずわれわれも,多くの国の研究報告と同じに,まず治したい各症状やいくつかの検査値の動きを新薬,対照薬群別に集計し検討をする.しかし同時に患者1人ごとに,その症状がどの程度に改善したり,あるいは悪化したかという病気の経過を個人別にまとめて全般的な改善度を評価する.

1. 著明改善

2.中等度改善

3.軽度改善

4.不変

5.悪化

などと多段階に最終的に「全般改善度」を判定する.

治療中に血圧などの測定値や検査値がある程度欠落しても判定できる.周知のように,ある1人が改善したときに,その改善が薬が効いたためだけなのか,病気の自然経過が重なっているのか,心理的暗示も加わっているのかは解らない.確実なのは病状が改善したか,不変か,それとも残念ながら悪化したかという経過である.個人別に改善の要因は不明でも,試験薬群,対照薬群を集団として比較してはじめて,対照薬群の種類によっては,試験薬群の改善の要因が推定できるようになる.


8.「概括安全度」(global safety rating GSR)

他方副作用や予期しないイベント(出来事)の発生について「概括安全度」を判定する.副作用などは原則として治療前には正常だった部分に出る.いわば病人に現れる.普通は発生数は少数であるし,各臓器に分散して現れる.そして発疹が何例,頭痛が何例という集計を行い,さらにこれらを合計した総件数としてまとめて表現され,試験薬群と対照薬群の間で比較される.しかしコントローラー委員会では,これらのデータに加えて,同じ発疹でも若い女性の顔に出たり,1人の患者にいくつかの種類の障害が出れば,その身体的,心理的な障害の程度は個人で違ってきて複雑になると考える.そこで個人,個人でその障害をどう受けとめるかを判定する.このときに専門的に患者に助言できるのは主治医である.しかし中にはことわり無く服薬をやめてしまう人も,来なくなる人もいる.こういうケースに重大な副作用が潜んでいる可能性は高い.来ないということ,その理由も知らせてこないということは重大な情報である.失火,事故,自殺,犯罪などのためであったり,さらにそのイベントの原因に眠気,低血糖,うつ症状,意識もうろう,不機嫌発生などが関与している可能性もある.来ないという事実もひっくるめて,安全性について個人ごとに次のような3〜5段階に判定する.

1. 注意し治療

2.減量か副作用等の治療追加

3.中止・脱落・死亡

「全般改善度」の項で付記したと同じに,副作用らしいことが起こっても,それが薬によって起こったものか,無関係な偶発的な事故なのかは個々のケースでは解らないことが多い.そのときにはとても副作用としては考えられない事故であっても記載すべきである.のちに集計して比較したり,市販後調査や病理化学的に副作用としてはっきりすることがある.そのために,はじめに予期しなかったことは,身体的な症状,疾患,それによる死亡,さらに心理社会的なイベントなどでもその事実を記載する.眠気が訴えられたとき,運転をよくする人や受験勉強中の学生では「2.減量」という判定になっても,暇なときに居眠りをする無職の老人では,本人の意見では「1.注意し治療」とされよう.イベントは薬との関係では中立に扱われても,発生した患者にとっては価値判断なのである.国民の多くが自動車を運転する国と,まだ車が普及していない国とでは,その薬のその社会での価値は当然違ってくる.薬と服用患者の関係は,genotypeとphenotypeの関係とも言える.DDTやBHCの社会的価値が国によって非常に違うのはこのような事情による.


9.「有用性」(global utility rating, GUR. clinical usefullness)

「全般改善度」と「概括安全度」の2つの概括判定は,患者1人ごとのベネフィットとリスクであるが,この2つを考慮して最終的に患者ごとに「有用性」の程度が判定される.主治医は,治療経過の順調さ,快適さを,患者の意見を尊重して「有用性」としてまとめる.専門家や薬効プロジェクトごとに同じ言葉ではないが,たとえば,

1. 著明に有用

2.中等度に有用

3.軽度に有用

どちらとも言えない

5.この経過は好ましくない

このような概括判定は臨床経過についてよく使われるexce11ent,fair,poorというまとめ方に似ていて,医師たちだけでなく患者や家族にとっても日常言いなれた治療評価である.ここでは統合体としての患者の主観も,臨床医としての経験的総合判断も尊重され集約されうる.またこれらの概括判定は,最近言われ出しているQOL(Quality of Life)の意味とも重なるところがある.なお脱落して検査データが初期値しか無いために全般改善度がつけられない患者であっても「有用性」をつけることはできる.脱落理由が不明であっても,「この経過は好ましくない」とされるだろう.つまり有用性の判定は情報欠落の有無にかかわらず対象患者全員で判定できるし,経過中起こった重大な異常はここで把握される.第V相試験であるならば,この個人別の総合判断こそ発売後の使用され方の予測になる.すでに述べたように,一般に改善度,安全度,有用度と言っても,それらの変化はすべて薬が原因とは言えない.自然変動も,プラセボ効果なども入っている.それらを含めて患者個人ごとの経過やQOLが正確に記載され,評価される.ランクを決めても文章による記述を追加することは大切である.

たとえばコレステロール降下薬の場合,薬物群とプラセボ群の間で,全死亡率が同じであったら,多くの死因が副作用としては現在納得できなくても,まず生死に関しては薬物はプラセボと同じである.血圧降下薬と似てコレステロール降下薬には心身の機能にdepressionをもたらすのかも知れない.心筋梗塞で急死したくないなら薬をのむ人もあるだろう,また服薬量を減らして血中コレステロールの値を下げすぎないようにすれば死亡率に差が出るかも知れない.データの再分析で教訓が得られるかも知れない.以上で日本における概括判定の構造を説明したが,これに対して医師を信頼しすぎるという批判がある.オープンの比較試験ではこの批判が成立する場合もあり得るが,十分に配慮した二重盲検法ならば主治医と患者の総合判断はたとえばらついても偏りはせずに妥当性が発揮できるはずである.


10.ノンパラメトリック統計

つぎの待徴とされるのは,委員会ではノンパラメトリック統計を原則としていることである.すでに30年たつが,日本では1960年前後に質間表や日常行動評価表(Behavior Rating Scale)の数量的表現に関して,人間は数量では代表できないという反論が起こった.極端に言えば数学派と文学派とも言える.たしかに広く知られているダーウィンの「種の起源」,ファーブルの「昆虫記」,コンラッド・ローレンツの多くの著作などは,言語表現が優れていることを示している.これを超えるのは音声・映像表現だけであろう.ここでの情報量は膨大である.治療によって治った患者,治らない息者などを診療した主治医の受け取る情報も同じく膨大である.それを単純に数量化することには,低抗したくもなる心理的,かつやや誠実でもある理由がある.

こういう対立状況を了解したうえで議論をするにはノンパラメトリックな統計学という場は最適である.Stevens S.S.らの名義尺度(nominal scale)順序尺度(ordinal scale),間隔尺度(interval scale),比例尺度(ratio scale)という理論的な分類が議論の交通整理に役に立つと言える.各尺度の水準に基礎を置いたノンパラメトリック統計学は,心理学,医学,社会学などの行動科学の統計学と言われるだけあって,連続性がなくても,正規分布していなくても,またゼロ点がはっきりしていなくてもかまわない.それぞれの尺度に応じての統計・検定がある.正常人集団では正規分布する血圧やコレステロール値であっても,ある値以上を高血圧や高コレステロール血症として対象にすると,当然正規分布ではなくなるので,平均値や標準偏差は無意味であり,順序尺度でしかあつかえない.現場の要求によっては平均値などパラメトリックなデータ処理の追加もありうるがノンパラメトリック統計学を基礎に置くと,デー夕の数的表現の第一歩から代表値,集計,検定にいたるまで,議論のもととなるような仮定を置かないですむという利点がある.

また比較的説明しやすく,臨床医にもわかりやすいと言える.「わかりやすいことは民主主義成立の条件の一つである」というような大上段の議論に持ち込むつもりはないが,とかく統計学を敬遠しがちな臨床医にも受け入れてもらうことも大切な目標である.各症状間の関連,発生順序,重さの変化など分野ごとの臨床の複雑な実態にくわしいものこそ,それらの統計の是非,過不足,活用,進歩についての議論に参加してもらうことが重要である.その理由は,統計の論理は医学の外の統計学のなかにあるのではなく,すべての学問の内部の論理であり,日常会話の論理ですらあるからである.


11.薬効判定の汎用プログラム

委員会では,薬効判定のための汎用プログラムを1972年,74年(多重性に関して1988年)に作った.このプログラムは,可能な範囲で入力と出力の定型化をはかった.コントローラー2人の持ちよる薬剤のキーコードが入力されたあとは,2時間後の出力までをすべて自動化してある.このためにコントローラーをする委員の負担は,@薬剤間で識別できないように,製剤,包装がなされているか調べる.A無作為割付けをやり,Bキーコードを厳重に保管する.C開封会議に出てキーコードを入力するというだけですむようにした.臨床医が中心の組織であるために,受け持ち患者の容態が急変して,すぐ駆けつけることがあり得る.しかしそれでも重い責任を持ってもらうために,時間的な拘束を最小限にした.残りの部分は事務局だけでほとんどの作業ができるようにしてある.


12.20年間の業績

資料編は,事務局全員の手作業によって,急きょ集計されたものである.

資料の2は,コントローラー委員会と機関誌「臨床評価」のこの20年のあゆみが示されている.医薬品関係の事故と,行政および医薬品業界のうごきとを年代順に対比して状況をつかみやすくしてある.

資料の3は,コントローラー委員会の委員による研究,調査の題名,発表誌名が列記されている.さらに学会,大学,研究グループ,文部省,厚生省,科学技術庁の研究,調査にたいしてコントローラー委員会から人的,学問的,技術的,資金的な協力を行ったものが,これも年代順に合計24の論文があげられている.

資料の4は,疾患名または効能分類による治験の数の一覧表である.この20年間に746の治験プロジェクト(年間平均37)が処理され,ほぼ全分野にわたり数十ずつの治験数になる.最近規模の大きい長期管理試験や市販後調査の合計25プロジェクトも継続中であり,総計は771になる.

資料の5は,おもな疾患において,対照薬として選ばれた市販薬の名と,その治験年度の幅および対象症例数が示されている.標準薬ないし対照薬に変遷のあるものがみられる.整理できた疾患では,まず脳血管障害ではプラセボが対照にされた治験が17ありその対象患者数は2016人であることを示している.以下順に高血圧,胃・十二指腸潰瘍,精神分裂病,神経症,うつ病,不整脈,骨粗しょう症,慢性肝炎の表がある.はっきりした治療薬のある高血圧,胃・十二指腸潰瘍,精神分裂病,うつ病,不整脈では,日本ではプラセボ対照実験は少ない.しかし統計的有意差は出ても,効き方の差が少ない疾患,たとえば脳血管障害,神経症,骨粗しょう症,慢性肝炎などでは,プラセボ対照が多い.ただし新薬とプラセボの2群比較というよりは,治験薬,標準薬,プラセボの3群比較が多い.資料4との間で小計が合わないところがあるのは,少ない対照薬が省略されたのと,同一プロジェクトで3剤比較がなされていたりしたためである.

資料の6は,治験薬と対照薬の優劣の図表である.治験全体では全般改善度で治験薬が統計的な有意差で優れていた場合は34%で,有意差をもって劣ったものも4%見られた.さすがにプラセボと比べたときには52%の治験薬は有意に優れた.しかしほぽ半分の46%では有意差無しとなっている.さらに,偶然の可能性も含めて2%では治験薬が劣っていた.安全度では治験薬のほうが有意に安全であるとなったのは13%しかなく,12%では安全性の上で劣っている.当然ではあるが,プラセボと比べると実薬である治験薬が安全度では劣った治験は22%ある.しかしプラセボよりも安全という結果がでたのが4%あった.有用度は,安全性に大きな問題がないときには,ほとんど全般改善度の結果と同じである.しかしプラセボを対照としたときには,副作用などが考慮されて全般改善度での52%が有用度では48%に減っている.

資料7は疾患名または効能分類による優劣表(全般改善度)である.資料6の治験数502より6件少ないが,疾患または効能分類によって対照薬(実薬)との優劣が示されている.抗うつ薬はこの20年標準薬を超えるものが出ていない.

資料8は同じく疾患名または効能分類による全般改善度のプラセボ対照における優劣表であるが,これは資料6の治験の内容である.これらのネガティブデータは「臨床評価」誌に掲載されている.


13.コントローラー委員会の20年を振り返って

機関誌「臨床評価」誌を発刊したころ,司会の清水直容先生が「3号でつぶれる」と予想していたのに,20年も続いたということは,その理由を考える必要が出てくる.そうすることで,この委員会システムの存在・継続理由の別の面も現れる.まず第1に,日本では20年,30年前には,二重盲検試験どころか,比較試験もほとんど行われていなかった.狭心症の薬でアメリカで二重盲検法という命名(Greiner)が使われたのは今から40年前の1950年である.carefu11y controlledなどと名付けて第3者が割付けをする客観的な治験を行って,グルタミン酸の知能改善作用を否定した論文がいくつも出てきたのも1950年,1951年であった.そのために,日本でも1965年からいわゆる行政指導的に,当時の新薬調査会が主体となって,臨床評価の水準を上げようという意気込みで,申請する企業にたいして指示・実施させていった歴史的経緯がある.

第2に多くの製薬企業が,実施機関としての委員会の厳しいシステムを了承した上で,第3者機関としての評価を尊重した.企業全体としてではなくても,自分の会社が,意識的にせよ,無意識的にせよデータの作為(いわゆるメーキング)のような不名誉なことをしないよう望んでいる人たちは多い.

第3の継続理由は,すべてではないにしても臨床医の側からの支持が続いていることである.1970−80年代にかけて,各大学や学会での人体実験に関する議論や製薬企業との癒着批判が起こった.これらはふだんから医師たちのあいだでささやかれてはいても,表には出てこないことがらであった.それまではプロパーまかせにしていた治療薬の評価について講演を頼まれたり,委員会の機関誌「臨床評価」にのせた論文や翻訳資料が参考にされもした.企業との間に委員会が第3者機関として入ると,大学のキャンパスで学生たちから,企業の手先として批判されにくくもなる.また測定水準や統計的な議論,計画の妥当性,デー夕処理の信頼性などにおいても,中立の立場を貫けるなどのことが考えられる.

第4に,これら全体の背景として,わが国では薬務局に医師がいない上に,(生物製剤課長1人が医師)人数と予算が足りなさすぎる.またさらに日本の多くの製薬企業でも臨床医が少ないという事情がある.そういう状況のために,医学部の中では,医師たちのあいだで薬の開発,治験に関心を持つ人は少ない.保険医療制度の中で,臨床医が患者の診療に非常に忙しいためもあり,画期的な薬の開発がそうあるわけでもなし,またさらに今までいくつかの経緯もあって,企業や薬との関係を敬遠する風潮すら一部にみられる.臨床医による自発的副作用報告が日本で少ないこととも絡んで待異な状況と言えよう.


14.今後の展望

こういう中であるにもかかわらず,またこういう日本的状況であるからこそ,この委員会がこれから先にも,多くの分野の指示を得て活躍していくとすれば,川の上流における先進的研究にも寄与できるような,中流,下流における公正で迅速な評価体制作りに協力してゆくことはできる.

今後,膨大なデータベースの整理と索引づくりを進め,一般にも開かれた通常のデータベースサービスができるようにしたい.そのあと疾患,薬効分野ごとに,データの再吟味もやってゆく必要がある.そのさい起こってくるであろう臨床上の疑問について,関係のある疾患・薬理・病理の専門家も加えて,奏効機転・機序や,改善,副作用発生の要因などの解明を試みるべきであろう.多数の中立,公正な症例報告を基にした,世界にも誇りうるきわめて良質のデータがこれだけ蓄積されている.多くの反省材料,疾患の潜在的構造,また今後の改良,発展の素材も,このデータベースの中にある.


15.悟頼される社会システムの構築と発展のために

1983年,私が新薬調査会委員を辞めたあと,公定書協会の講演会で,第3者システムの必要性を協調した.製薬メーカーのつくる,または作らせる薬効報告論文の,日本での状況からみて,もっと医師,薬剤師や国民が信頼しうるような,第3者評価による制度が必要であると力説した.今年ようやく「一般指針」にコントローラーの役割が書かれ,また「中立的立場のものをコントローラ一として委託することもよい方法である.」と書かれた.一歩前進と言える.今後この言葉の具体性をめぐってさらに議論が起こるであろうが,ここは統計検定などと違って,専門家でなくても良くわかることである.したがって一般に開かれた議論が行われなければならない.公正で信頼される薬効評価が,行われるようにする責任は,まず第1には個々のメーカーにある.しかしときどき不祥事が表にでるからには,業界団体として自発的な民間での相互規制が必要になる.しかしこれとは別に企業に正しい評価をさせる,または自らが評価をする責任が行政にもある.他方ユーザーである医師または医師会,学会もまた独自に主体的に薬効評価をしようと思えぱやれる道がある.そしてこれらの評価が信用できないとき,または信用できても改めて,薬を服用する,またはそのうちには服用する可能性のある,息者,家族,一般市民が評価に乗り出す可能性も無いわけではない.

それぞれの立場での,評価が可能ななかで,われわれは,企業,行政,医師,法律,統計の立場を汲んで,あるいは今後さらにメンバーを追加する可能性を含みつつ第3者機関を20年間運営してきた.この方式はいわゆる第3セクターに比べてきわめて身軽で,あらたな投資はほとんど必要ない.最終権限は行政にあるが,行政または中央薬事審議会・新薬調査会として,入手したいデー夕の作成は,すでに述べたようなコントローラーの派遣で意向を反映し公正さを確認させることができる.しかし,なお残る疑問,反論について以下に所信を述べる.

第1に,最初の段階で厳密に評価しなくても,第IV相・PMS(市販後調査)で再評価されたり,淘汰されるという主張がある.しかし制度的,社会的淘汰には時間がかかる.医薬品は多くの商品の中でも,生死,健康に直接かかわるうえに,その費用は国民の拠出金と税金によって保険診療としてまかなわれるのである.あいまいな評価の薬を市販させることによる,大規模で非統制的な実験を無期限に続けるのは非人道的である.しがたって,はじめにできるだけきちんと調べるべきである.

第2に日本では,薬効の追試が困難である.有効率の差が少なくても,統計的に有意差を出そうとするためもあって,ひとつの二重盲検法による治験が数百人規模になる.こうなると市販後に追試することは簡単ではない.欧米では,抗心筋梗塞や抗脂血薬を,承認時の治験期間をはるかに超えて盲験法で調べている.しかし日本では同規模の追試もされたことはない.やり直しがきかないという意味でも,経済性でいっても,最初の比較試験がとくに重要なゆえんである.

第3に,日本ではいったん市販されても,市場原理が働かないような機構になっている.それは患者への有用性を無視まではしないにしても,行政がきめる保険での支払い薬価と,実際に販売会社が売る値段の差(薬価差)が市場での優劣,占有率をきめるからである.しかも出来高払いとなっているので,多く検査し,薬価差の大きい薬を多剤処方するように傾く.そうなるとプラセボに近い弱い効果のものが,多剤処方の理由にもなり,喜ばれる.速く単独で十分効く薬は敬遠される.日本の保険診療では制度的に,論理的にこういう方向への誘導の可能性がある.それにもかかわらず,日本での国民医療費が抑制され,しかも高寿命と長時間労働を支えているのは,保険局の細かい規制と,臨床医の専門家として学問と良識の結果であろう.

第4に,フロイドによる,無意識の偏向,忘却の理論にもある通り,二重盲検法は,その根本理念として第3者性を前提としている.開発した利害関係企業が,実質的に1人のコントローラーを指名して,その雑務も企業がやるというような,名義借りに近いことをするほどのことはないとしても,手続きはもっと公開されていたほうがよい.また,医師,治験総括医師の嫌う雑務というが,実はこの雑務が,もっとも微妙で結果を左右する大切な仕事である.行政指導でこまごまと手続きを規定し,そのチェックシステムをさらに追加しても,屋上,屋を架するのみで,しかも公正性の確証は得られない.

以上で,コントローラー委員会20周年を契機として,委員会の,さらには日本や各国の医薬品の公正評価の方策について,私とコントローラー委員会のメンバーたちの主張を展開した.


清水(座長):佐藤先生,ありがとうございました.佐藤先生は,われわれが描いてきた絵を,あまりにも自画自賛されたような気がして,ちょっと心配なんですが.それでは何かコメントございませんでしょうか.

テンプル:今まで行われた多くの研究におきまして,実薬との比較が行われていたと思います.その結果を,たとえばプラセボ比較の結果を見ますと50%が,ネガティブな結果にでていると思います.差がでなかったと.そこで実薬対実薬の比較の場合に,結論として,新薬に差が無くても,有効と言ってよいのでしょうか.それとも,優越性が無くては有効と言ってはいけないのでしょうか.プラセボと実薬の差が50%出ないということは,たとえば,2剤間に差が無いという結果がでたとしても,それはあまり意味を持たないということになると思うのですが,いかがでしょうか.

佐藤:実薬との比較は,現場の臨床医が,どうしてもプラセボを使うことに賛成しないせいであって,プラセボが使われるということは,効くか効かないかに関して,疑義があるという点で皆が一致し,そのため,プラセボの方がいいまたはプラセボと対照薬の3群比較というのが増えたと思います.それから,標準薬,ないしは,対照薬と同じであった時にそれが,薬として許可されるかどうかは,分野ごとに違います.薬の種類が,まだ少ない分野は,比較的ほぼ同じであっても承認されますし,非常にたくさんあるところは,そんなにいらないし,医者が覚えきれないというような意見もでて,やや厳しくなります.これで,よろしいでしょうか.

テンプル:はい,結構です.たとえば,うつ病などの場合ですが,50%以上の研究がプラセボと差がなかったわけですけれども,そうなりますと,たとえば,2剤を比較して,実薬対実薬の比較で差がないと,あまりこれは効かないということになります.ところが,尿路感染症の場合ですと,これは,有効な薬剤,効かない薬剤,プラセボが入ってなくても,簡単に有効性の実証は得られるのですが,抗うつ剤などは難しいわけで,たしかに私も医者で,医者としてはプラセボはできるだけ使いたくないというのは事実です.

佐藤:うつ病の薬は,プラセボとやったのは,日本ではたった1つしかないのです.残りは,全部イミプラミン,アミトリプチリンなどの実薬と比べて,我々もそのようなものだけしか,経験しておりません.だから,プラセボとは比べておりません.

座長:どうもありがとうございました.


Controller Committee ホームページへ戻る
コントローラー委員会へ戻る