如果这个游戏持续的玩下去 (iterated prisoner's dilemma), 会是什么结果呢?诺贝尔经济学奖获得者 Robert Aumann 发现,理性的玩家会让合作策略(即双方都不招)的结果出现。另外一位政治学家,数学家 Robert Axelrod 上世纪组织了一个这个游戏的比赛(IPD tournament),让大家编写程序来玩这个游戏。这个比赛是循环赛,每局的得分相当于 -1 乘以获得的刑期。他发现偏向合作的程序获得的总分数显著高于偏向背叛的程序。这个游戏的胜利者的策略是所谓一报还一报(tit for tat), 程序只有四行。它的规则是,第一步选择(和同案犯)合作,即不向警方招认;此后每次采用对手上次的策略。略微的改进是此后以小概率选择合作, 即选择宽恕对方若干次 (Tit for Tat with forgiveness)。 Axelrod 总结道,好的策略应该有几个必要条件: