正確な物差しをどう作るのか

プログラムのテストをしていて、たまに、
「正解」の結果は何なんだろう、と思います。
 
Aがreferenceで、Bがプログラムのアウトプットである場合に、
A=Bならばプログラムが正しい、
とテストを作成したとして、
“A”が正しいとどうやって保証するのか。
 
referenceの正確さを保証する工数と、
referenceとoutputの間に生じる誤差がどこまで許容できるか、によってくると思うのですが、
例えば金融であったり、医療であったり、インフラであったり、
クリティカルな場面においては、その誤差が結構シビアにつめていかないといけないのでは?
とか思いつつ、反面、どの分野も競争で開発サイクルが早くなったりして、
その中で正確さをいかに保証していくか…

みたいなことを考えたりもしましたが、あまり考えがまとまらないまま一日が過ぎたのでした。