Predicting When RL Training Breaks Chain-of-Thought Monitorability

		Predicting When RL Training Breaks Chain-of-Thought Monitorability (lesswrong.com)
		2 points by gmays 11 days ago \| hide \| past \| favorite \| discuss

		help