教材一覧
教材検索
EXAMPLES OF GAMES

囚人のジレンマの例:オンライン講義(リモート授業)における成績判定

目次

Share on twitter
Twitterで共有
Share on email
メールで共有

オンライン講義における成績判定

大学がオンラインによる遠隔授業を導入する中で、学期末の成績判定をどのように行うべきかが問題になります。従来のように学生を1つの教室に集めてペーパーテストを実施することができないため、オンラインでも試験や成績評価を公平に行うための仕組み作りが必要です。特に、オンラインでペーパーテストを行う場合、学生による不正行為を監視することは技術的に困難です。モニター越しに学生の様子をこまめに確認することもできますが、視認できる範囲はどうしても限定されるため、カンニングペーパーなどの不正を防ぐことは実質的に不可能です。

オンラインで行われるペーパーテストにおいて、学生が不正を行うかどうかを選択する状況を想定します。技術的な理由により、学生は不正を行っても露見しないものとします。他の学生たちが不正を行わない中で自分だけが不正を行う場合、自分だけが有利になります。逆に、自分は不正を行わず、他の学生たちが不正を行う場合、自分だけが不利になります。全員が不正を行う場合や、全員が不正を行わない場合には、特定の学生が有利になるわけではありません。ただ、不正を行うためには準備に労力が必要であることに加え(カンニングペーパーの作成など)、不正には罪悪感も伴います。したがって、それぞれの学生にとって、全員が不正を行わない状態は、全員が不正を行う状態よりも望ましいと言えます。

 

完備情報の静学ゲームとしてのオンライン試験

以上の状況を\(n\)人の学生が参加する(ゲーム理論の意味における)ゲームと解釈します。学生たちはお互いに知り合いであるため、事前に話し合いをしようと思えば可能です。ただ、そこで学生たちが何らかの約束をしても、その約束には拘束力はありません。試験はオンラインで行われるため、それぞれの学生は、他の学生が実際に不正をしたかどうかを観察できず、したがって、約束が履行されたかどうかを立証できないからです。したがって、問題としている状況は非協力ゲームです。さらに、多くの場合に試験は一斉に開始することに加え、先の理由により、それぞれの学生は他の学生が不正を行っているかを観察できない状況下において、自分が不正を行うかどうかを決定する必要があります。したがって、問題としている状況は静学ゲームです。さらに、以上の状況が学生たちにとっての共有知識であることを仮定するのであれば、問題としている状況を完備情報の静学ゲームとして記述することができます。

そこで、状況を以下のような戦略型ゲーム\(G\)としてモデル化します。まず、プレイヤー集合は\(I=\left\{ 1,\cdots ,n\right\} \)です。\(n\)は有限な自然数であり、\(i\in I\)を学生\(i\)と呼びます。任意の学生\(i\)の純粋戦略集合は\(S_{i}=\left\{ NC,C\right\} \)です。ただし、\(NC\)は「不正を行わない」という選択肢に相当し(Non-Cheaterの\(NC\))、\(C\)は「不正を行う」という選択肢に相当します(Cheaterの\(C\))。問題は、それぞれの学生\(i\)の利得関数\(u_{i}:S_{I}\rightarrow \mathbb{R} \)をどのように記述するかです。

それぞれの学生が自分を除く\(n-1\)人の学生を個人として区別しないのであれば、プレイヤー\(i\)の利得関数を、自分が選ぶ純粋戦略\(s_{i}\in S_{i}\)と、自分を除く\(n-1\)人の学生の中で不正を行わない人数\(c\ \left(=0,1,\cdots ,n-1\right) \)を変数として持つ関数\begin{equation*}u_{i}:S_{i}\times \left\{ 0,1,\cdots ,n-1\right\} \rightarrow \mathbb{R} \end{equation*}として定式化しても一般性は失われません。では、効用関数\(u_{i}\)に対してどのような性質を要求すべきでしょうか。

前提として、学生は自分が良い成績を収めることを目的に試験に臨むものとします。自分以外の学生たちの中で不正を行わない人たちが何人であるかに関わらず、自分は不正を行えば、そうでない場合よりも有利になるため、良い成績を収める確率は上昇します。以上を踏まえた上で、任意のプレイヤー\(i\in I\)について、\begin{equation*}\forall c\in \left\{ 0,1,\cdots ,n-1\right\} :u_{i}\left( C,c\right)
>u_{i}\left( NC,c\right)
\end{equation*}が成り立つものと仮定します。

全員が不正を行う場合と、全員が不正を行わない場合を比べると、両方において特定の学生が有利になるわけではありません。したがって、良い成績を収める確率という観点から評価すると、学生にとって両方の場合に差はありません。ただ、不正には労力と罪悪感が伴うため、学生にとって全員が不正を行わない場合の方が望ましいと言えます。以上を踏まえた上で、任意の学生\(i\in I\)について、\begin{equation*}u_{i}\left( NC,n-1\right) >u_{i}\left( C,0\right)
\end{equation*}が成り立つものと仮定します。

学生が不正を行う場合、他の学生の中で不正を行わない人たちの数が多いほど自分はより有利になるため、自分が良い成績を収める確率も上昇します。以上を踏まえた上で、任意の学生\(i\in I\)について、関数\begin{equation*}u_{i}\left( C,\cdot \right) :\left\{ 0,1,\cdots ,n-1\right\} \rightarrow \mathbb{R} \end{equation*}は変数\(c\)に関する狭義の単調増加関数であるものと仮定します。一方、学生が不正を行わない場合、他の学生の中で不正を行わない人たちの数が多いほど自分はより不利ではなくなるため、自分が良い成績を収める確率も上昇します。以上を踏まえた上で、任意の学生\(i\in I\)について、関数\begin{equation*}u_{i}\left( NC,\cdot \right) :\left\{ 0,1,\cdots ,n-1\right\} \rightarrow \mathbb{R} \end{equation*}は変数\(c\)に関する狭義の単調増加関数であるものと仮定します。

以上によってオンライン試験における不正問題を描写する戦略型ゲーム\(G\)の定義とします。改めて整理すると、このゲームのプレイヤー集合は試験を受けるすべての学生からなる集合\(I=\left\{ 1,\cdots ,n\right\} \)であり、任意の学生\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ NC,C\right\} \)です。ただし、\(NC\)は不正を行わないこと、\(C\)は不正を行うことをそれぞれ意味します。それぞれの学生\(i\)の利得関数は、自分が選ぶ純粋戦略\(s_{i}\in S_{i}\)と、自分以外の\(n-1\)人の学生の中で\(NC\)を選ぶ人数\(c\in \left\{0,1,\cdots ,n-1\right\} \)を変数として持つ関数\(u_{i}:S_{i}\times \left\{ 0,1,\cdots,n-1\right\} \rightarrow \mathbb{R} \)であり、以下の条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( C,c\right) >u_{i}\left( NC,c\right) \\
&&\left( b\right) \ u_{i}\left( NC,n-1\right) >u_{i}\left( C,0\right) \\
&&\left( c\right) \ u_{i}\left( C,\cdot \right) \text{と}u_{i}\left(
NC,\cdot \right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}をすべて満たすものとして定義されます。

利得関数に関する仮定\(\left( a\right) ,\left( b\right) ,\left( c\right) \)より、オンライン試験における不正問題を描写する以上の戦略型ゲーム\(G\)は\(n\)人囚人のジレンマに他なりません。つまり、以上のゲームにおける\(NC\)が囚人のジレンマにおける協調戦略に対応し、\(C\)が囚人のジレンマにおける裏切り戦略に対応します。

 

オンライン試験における不正問題の均衡

オンライン試験における不正問題を描写する戦略型ゲームにおいて、すべての学生が不正行為を行うことが狭義の支配戦略均衡になります。

命題(オンライン試験における不正問題の均衡)
戦略型ゲーム\(G\)のプレイヤー集合は\(I=\left\{ 1,\cdots,n\right\} \)であり、それぞれのプレイヤー\(i\in I\)の純粋戦略集合は\(S_{i}=\left\{ NC,C\right\} \)であり、利得関数\(u_{i}:S_{i}\times \left\{ 0,1,\cdots ,n-1\right\} \rightarrow \mathbb{R} \)は以下のすべての条件\begin{eqnarray*}&&\left( a\right) \ \forall c\in \left\{ 0,1,\cdots ,n-1\right\}
:u_{i}\left( C,c\right) >u_{i}\left( NC,c\right) \\
&&\left( b\right) \ u_{i}\left( NC,n-1\right) >u_{i}\left( C,0\right) \\
&&\left( c\right) \ u_{i}\left( C,\cdot \right) \text{と}u_{i}\left(
NC,\cdot \right) \text{は}c\text{に関する狭義単調増加関数}
\end{eqnarray*}を満たすものとする。ただし、\(c\)はプレイヤー\(i\)を除く\(n-1\)人のプレイヤーの中で戦略\(NC\)を選ぶ人数である。このゲーム\(G\)には狭義の支配戦略均衡が存在し、それはすべてのプレイヤーが\(C\)を選ぶことである。
証明

プレミアム会員専用コンテンツです
ログイン】【会員登録

戦略型ゲーム\(G\)に狭義の支配戦略均衡が存在する場合、プレイヤーたちが合理的であるという事実が共有知識でない場合においても、それぞれのプレイヤーが合理的でありさえすれば、プレイヤーたちはその均衡をプレーします。オンライン試験における不正問題を描写する上述のゲームでは全員が不正を行うことが狭義の支配戦略均衡であるため、それぞれの学生が合理的であれば、彼らはその均衡を実際にプレーすることが予測されます。

オンライン試験における不正問題においてそれぞれの学生は、他の学生たちが選択する行動がいかなるものであっても、自分は不正を行った方が不正を行わない場合よりも大きな利得を得られます(\(C\)が\(NC\)を狭義支配する)。したがって、学生が合理的である限りにおいて不正を行います。しかし、全員が不正を行う場合に自分が得る利得は、全員が不正を行わない場合に得る利得よりも小さくなってしまいます。他の学生たちにとっても事情は同じであるため、自分だけでなく他の学生たちにとっても全員が不正を行わないことは全員が不正を行うことよりも望ましいはずです。つまり、それぞれの学生が自己の利得を最大化するために行動する場合、得られる結果は他の学生にとってだけでなく自分にとっても最適なものにならないという意味において、オンライン試験における不正問題は興味深い例になっています。

 

不正問題への対策

以上のシナリオは特定の仮定に依存した理論的な予測であり、現実には、すべての学生がオンライン試験において不正を行うわけではありません。以上のシナリオを成立させている最も重要なポイントは、利得関数に関する以下の仮定\begin{equation*}
\forall c\in \left\{ 0,1,\cdots ,n-1\right\} :u_{i}\left( C,c\right)
>u_{i}\left( NC,c\right)
\end{equation*}です。つまり、任意の学生にとって不正を行うことが狭義の支配戦略であるからこそ、全員が不正を行うことが狭義の支配戦略均衡になります。

実際には、多くの学生は十分なモラルを有しています。加えて、実際には、たとえオンラインであったとしても不正が露見する確率はゼロではなく、不正が露見した場合のデメリットは大きいため(単位剥奪・停学・退学など)、先の仮定は成り立つとは限りません。

とは言え、オンライン試験が先述の問題を内包していることは事実であり、不正を行った学生はそうでない学生よりも有利になります。不正が露見しにくいオンライン試験では正直者が損をする構造になりがちであるため、そうならないような対策が必要であるということです。問題を解決するために学生のモラルに期待するのはナンセンスです。そこで以降では、オンライン試験における不正を防ぐ方法、もしくは不正を行う意味そのものを消失させる方法を考察します。

学生が試験で不正を行う理由の1つは、不正の準備にかかる労力が、真面目に勉強する労力よりも小さいことにあります。例えば、講義ノートの内容を記憶して試験に臨むよりも、試験中に講義ノートをカンニングしたほうが楽です。それが難しい場合でも、カンニングペーパーを作成したほうがまだ楽です。したがって、多くの大学教員が実践しているように、試験中に学生が講義ノートを閲覧することを認めれば不正が不正でなくなるため、よりフェアになります。ただ、この方法にも欠点はあります。まず、講義の内容を記憶した真面目な学生の努力が評価されなくなってしまいます。また、学生の知識そのものが評価されるのではなく、ノート上手く作成する技術が評価対象になってしまうという点も問題です。

オンラインでペーパーテストを実施する場合にはカンニングの防止が技術的に困難であることから、レポート中心に成績評価を行うアプローチも実践されています。現在はコピペ・盗用チェックツールが発達しているため、不正レポートをある程度まで見分けることができます。ペーパーテストにおける出題形式を自由論説に切り替えるアプローチも考えられます。自由論説であればカンニングの有効性が限定されるからです。ただ、いずれの場合にも、代筆という不正には対処できません。現在はモバイルデバイスが普及しているため、オンライン試験中にリモートで代筆してもらいリアルタイムで答案を受け取ることもできるからです。

成績の評価体系を工夫することを通じて、試験において不正を行うインセンティブそのものを減少させるアプローチも存在します。日本の大学でもGPAを導入する動きが活発化していますが、試験で「不可」をとった科目をGPAに含めるかどうかは大学によって異なります。不可の科目をGPAの算出に利用する場合、そのような科目はGPAを大幅に下げてしまう要因になります。したがって、不可の科目をGPAの算出に利用しないように制度を変更すれば、少なくとも「カンニングをしてでも不可だけは避けたい」という動機は消失するため、その分だけカンニングが減ります。ただ、この方法ですべてのカンニングを防げるわけではありません。

Share on twitter
Twitterで共有
Share on email
メールで共有
RELATED KNOWLEDGE

関連知識

囚人のジレンマ

囚人のジレンマ

囚人のジレンマとして広く知られるゲームの最も基本的なモデルを紹介し、それを戦略型ゲームとして定式化した上で、その均衡を分析します。

クールノー競争

戦略型ゲーム(標準型ゲーム)

完備情報の静学ゲームを記述するためにはプレイヤー、行動、結果、利得などをそれぞれ具体的に特定する必要があります。それらの要素を記述する方法はいくつか存在しますが、ここでは戦略型ゲームと呼ばれるモデルについて解説します。

囚人のジレンマ

n人囚人のジレンマ

囚人のジレンマは2人ゲームですが、これを3人以上に拡張するとどのようなモデルになるでしょうか。n人囚人のジレンマと呼ばれるゲームについて解説します。

囚人のジレンマ

非対称的な利得構造を持つ囚人のジレンマ

これまではプレイヤーたちが同一の利得関数を持つ囚人のジレンマについて考えてきましたが、状況を少し一般化して、プレイヤーたちが異なる利得関数を持つ場合の囚人のジレンマについて考えます。

囚人のジレンマ

囚人のジレンマの例:軍拡競争

冷戦期に行われた米ソ間の軍拡競争は囚人のジレンマとしての側面を持っていることを解説した上で、そこでのナッシュ均衡を求めます。

支配戦略均衡

狭義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも狭義の支配戦略である場合、そのような戦略の組を狭義の支配戦略均衡と呼びます。

支配戦略均衡

広義の支配戦略均衡

戦略型ゲームにおける純粋戦略の組を構成する戦略がいずれも広義の支配戦略である場合、そのような戦略の組を広義の支配戦略均衡と呼びます。

DISCUSSION

質問とコメント

プレミアム会員専用コンテンツです
ログイン】【会員登録

ゲームの例