/ a# c5 b' W9 D还有就是Repast如何建立一个强化学习方式呢? 9 Z4 G+ R& l. o: f' Y) D i9 U5 L& R( @9 G& I0 O# p
我选择用RE强化学习方法,主要是Agent通过比较每次拍卖的利润和从前拍卖的利润平均相比较。可是这部分的初始倾向我还不太知道怎么弄? 3 ?1 Q+ j& M9 c
# H" q }1 M. }& W$ C
我理论上的东西都弄得差不多了,就是这个编程的不灵光啊 。 ' a: U+ P1 b. l6 R, c0 `0 S6 z" f1 w* {0 a' u w! y
胡言乱语,好紧张啊,3周之内要结果, 高手帮帮我吧