You are on page 1of 11

創造的思考

原田 勉
多腕バンディド問題
• どうすれば儲かる?
• 活用(exploitation)
• 探索(exploration)

利用したことなし よく利用する 少し利用する


ε-グリーディー法
• ランダムに数を引く、X
• IF X<ε, then act randomly 探索(過去にこだわらない)
• IF X>ε, then act optimally 活用(データの最適化)

占い、おみくじの効用=探索
大吉が出たら挑戦、それ以外なら保守的に!
ε≃5% が最適!
Exploitation vs. Exploration
• Exploitation(活用)
• 与えられたデータをもとに、成功確率が最も高いマシンのレバーを引

• Exploration(探索)
• 未知のマシンのレバーを引く
• 活用に特化すると、もっと成功確率が高いマシンを発見するこ
とができなくなるかもしれない。機会ロス
• 探索に特化すると、過去の情報を生かすことができない。
• 活用と探索のトレード・オフ!
創造性とは
• 創造性とは
• A combined manifestation of novelty and usefulness (Sternberg &
Lubart, 1999; Jung et al., 2010).
• Novelty → 拡散思考(divergent thinking)〜 探索
• Usefulness → 収束思考(convergent thinking) 〜 活用
• 創造性=f(divergent thinking, convergent thinking)
=f(exploitation, exploration)
• ただし、先行研究では、creativity=divergent thinking という
定義も多く使われている
個人の創造性
• 暗黙知から形式知へ
• Wallas
• 準備期(preparation)
• 孵化期(incubation)
• 啓示期(illumination)
• 検証期(verification)
• 問題点
• 準備・孵化からいかにして啓示にいたるのか?
• 暗黙知から形式知へと転換されるメカニズムとは何か?
• Arieti
• 内概念(endocept)→ イメージ形成(imagery)→ 原初的認識 → 概
念的認識
• 原初的認識=古論理(palelogic)

2020/6/12 Copy right 原田 勉 6


拡散思考と収束思考の関係性
• Threshold hypothesis(Guilford, 1967)
• 閾値hが存在する
• 知性g<h → 拡散思考と収束思考(知能)はプラスの相関
• 知性g>h → 拡散思考と収束思考は相関しない
• Kim(2005)のメタ分析
• r = .17
Q学習モデル
• Q𝑖𝑖 𝑡𝑡 + 1 = Q𝑖𝑖 𝑡𝑡 + 𝛼𝛼𝛿𝛿 𝑡𝑡
• δ 𝑡𝑡 = 𝑈𝑈 𝑅𝑅𝑖𝑖 𝑡𝑡 − Q 𝑖𝑖 𝑡𝑡
• 𝑄𝑄𝑗𝑗 𝑡𝑡 + 1 = 𝑄𝑄𝑗𝑗 𝑡𝑡
𝑒𝑒𝑒𝑒𝑒𝑒 𝛽𝛽𝑄𝑄𝑖𝑖 𝑡𝑡
• 𝑃𝑃 𝑎𝑎 𝑡𝑡 = 𝑖𝑖 = ∑4𝑗𝑗=1 𝑒𝑒𝑒𝑒𝑒𝑒 𝛽𝛽𝑄𝑄𝑗𝑗 𝑡𝑡

• 𝜃𝜃̂ = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑝𝑝 𝐷𝐷𝑠𝑠 𝜃𝜃𝑠𝑠 p 𝜃𝜃𝑠𝑠

β 逆温度 高⇒Exploitation 低⇒Exploration


α 学習率
報酬の比較
51.5 Rewards

51

50.5

50

49.5

49

48.5

48

47.5

47
one person two persons three persons four persons five persons
逆温度
Inverse temparature
9

0
one person two persons three persons four persons five persons
学習率
Learning rates
0.64

0.62

0.6

0.58

0.56

0.54

0.52
one person two persons three persons four persons five persons

You might also like