Ameriken ki . Byen koni ak yon chèchè entèlijans atifisyèl (AI) ki te fè kontri. Bisyon enpòtan nan domèn sikoloji mantal, nerosyans, ak entèlijans atifisyèl. Li sijere ke ka sa yo nan rezònman echwe akòz prezans nan enfòmasyon entèfere yo pa nouvo. Osi .
Bonè ke lè 2017, Ro. Bin Jia Percy Liang nan Inivèsite Stanford
te fè yon etid menm jan an, ak Achte an gwo sèvis SMS rezilta yo te menm jan an: Ki . Baze sou yon modèl LLM konsa, ou tou senpleman pa ka . Bati yon ajan serye Chanje youn oswa de mo ki pa enpòtan oswa ajoute kèk enfòmasyon ki pa enpòtan yo pral pwodwi repons diferan. Yon lòt manifestasyon nan enkapasite nan gwo modèl yo fè ase a.
Bstrè rezònman fòmèl se ke pi gwo pwo. Blèm nan, se pi mal
pèfòmans nan modèl yo gen tan షల్ మీడియాను ఇంటిగ్రేటెడ్ మరియు dans yo dwe. Sa ki annapre yo se dènye analiz GPT o1 pa ekip Su. B. Barao Kam. Bhapati: Egzanp sa yo . Baze sou seri done Mystery . Blocksworld la. Fast Downward se yon planifikatè agnostik domèn ki jere tout ka yo nan prèske an tan reyèl ak presizyon garanti. Rezilta de LRM nou teste yo (o1preview ak o1mini) te etone, men pèfòmans yo pa t esta. B epi yo te . Bese rapidman pandan longè a te ogmante. Pou ti pwo.
Blèm, pèfòmans LRM a se oke, men lè pwo. Blèm nan vin gwo,
pèfòmans li degrade rapidman. Nou wè menm sitiy aqb directory asyon an ak aritmetik non. B antye relatif. Ak tou de ansyen ak nouvo modèl, nou te repete o. Bsève ke pèfòmans desann rapidman kòm pwo. Blèm nan miltiplikasyon vin pi gwo. Konpare pèfòmans nan operasyon ki gen plizyè chif Menm o1 fè fas a pwo.
Blèm sa a: Yon lòt egzanp echèk nan rezònman fòmèl se echèk yo swiv règ yo nan echèk: Taksi ki kondwi pwòp tèt ou yo te anvizaje pa Musk ka gen yon pwo. Blèm ki san. Ble: Yo ka kapa. B kondwi san danje nan sitiyasyon ki pi komen, men yo ka tou lite pou rezone a. Bstrèman ase nan