生物科學門戶網站
BIO1000.COM

新的跨物種研究推動了決策理論的發展

關于我們如何使用獎勵信息進行選擇的達特茅斯新研究表明,人類和猴子如何根據所存在的信息的不確定性采用他們的決策策略。

这项研究的结果表明,对于一个简单的赌博来获得奖励,当奖励的数量或数量已知但奖励的概率未知且必须学习时,两个物种都会将其策略从合并中的奖励信息转换为乘法方式(其中奖励概率和幅度的函数相乘以获得所谓的主观价值)以相加的方式比较属性以做出决定。研究结果发表在Nature Human Behavior上挑战经济学,神经经济学和选择理论中最基本的假设之一,即决策者通常以乘法的方式评估风险期权,而事实上这只适用于有限的情况,当时关于奖励的幅度和概率的信息都很清楚众所周知。

“这是第一个使用类似实验设计的跨物种研究,表明当人们和猴子从风险选择(当已知奖励概率)到不确定时的选择(当奖励概率未知且必须是据悉,达特茅斯大学的心理学和脑科学助理教授Alireza Soltani表示,从以乘法的方式将信息结合起来,再以相加的方式比较信息。“比较奖励属性可能看起来像是将苹果与橙子进行比较;但是,当你比较不同的奖励信息而不是将它们结合起来时,你就会成为一个更灵活的决策者,”他补充道。

來自三所大學的研究團隊發現,當必須學習獎勵的概率時(但提供獎勵的幅度),隨著環境變得更加不確定,人類和猴子通常會選擇更大但更危險的選擇對概率的權重較小,對獎勵幅度的權重較大。該團隊還在任務期間檢查了猴子大腦中的神經活動,並發現這種行爲調整與前額神經元如何代表獎勵信息之間存在相關性。具體而言,與行爲一致的是,背外側前額葉皮質中的神經元在更加不確定的環境中表現出更大的強度,同時更大的重量。

要了解这些发现,请考虑以下假设情景(不是研究中使用的实际方法的一部分)。假装这是你的幸运日,你可以在免费的抽奖活动中赢钱。您需要做的就是从两个碗中选择一张门票:碗1包含99张中奖票,每张价值100美元,1张票价值0美元。Bowl 2包含50张价值250美元的中奖彩票和50张价值0美元的彩票。你选择哪个碗?大多数人会选择碗1,因为人类厌恶风险。碗1提供了更好的性能组合,即使碗2可能更有利可图。为了决定选择哪个选项,你可能会通过乘以获胜概率和获胜门票的主观效用或可取性来为两个碗中的每个选择一个主观值。

考慮另一種情況,您只知道每個碗中的中獎票的美元金額,但不知道挑選中獎票的概率。然而,你一直在觀察那些在你之前從兩個碗中選擇門票的人,並且得知碗1幾乎總能給出100美元的中獎票,但碗2只能獲得250美元的中獎票。在這種不確定的情況下,您可能會通過比較兩個碗獲獎門票相對于他們獲獎的門票數量來選擇您認爲更好的碗。在這種情況下,作爲決策者,您使用了一種附加策略,因爲您比較了兩個選項中的獎勵信息,而不是嘗試將其組合。

對于實際研究,在計算機上管理一系列賭博任務,猴子和人類參與者必須從兩個選項中進行選擇。人類(達特茅斯大學本科生)獲得了一系列積分,這些積分被轉換爲金錢和課程的額外學分,猴子(在耶魯大學醫學院和明尼蘇達大學學習)根據他們的選擇獲得了果汁滴。賭博的結果。

“更廣泛地說,我們的結果表明,在一個不確定的獎勵環境中,大多數情況下都是如此,我們可能無法構建所選擇的規範模型所規定的所謂主觀價值,而且靈活性比存在更爲重要。理性或最佳,“索爾塔尼補充道。

鄭重聲明:本文版權歸原作者所有,轉載文章僅爲傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。