―― 茶色い皿と0.5秒の推論エンジン ――
ナシカンダーの皿は、情報工学的に見ると最悪の入力データだ。
白米の上に、揚げ鶏、ゆで卵、オクラ、イカ。
そこへ複数のカレーソースが容赦なく注がれる。
赤、黄、黒が混ざり合い、最終的にはすべてが「茶色」になる。
境界線は消え、形状は崩れ、素材は完全にマスクされる。
Googleレンズに向ければ、おそらく「カレー」としか返ってこないだろう。
にもかかわらず。
レジに立つ会計係(通称:アネ)は、この皿を一瞥しただけで金額を告げる。
なぜ可能なのか。
そして、最新の画像認識AIは、彼に勝てるのか。
処理速度(Latency)
まずは単純な速度勝負。
AIはどう動くか。
画像を撮影し、クラウドにアップロードし、推論を走らせ、結果を返す。
最適化されていても、数百ミリ秒から数秒の遅延は避けられない。
一方のアネ。
皿が目の前に置かれた瞬間、間髪入れずに「8リンギット」と発声する。
考えている様子はない。
ロード画面もない。
判定は明白だ。
アネの勝利。
彼の脳内処理は、完全なスタンドアローン。
通信不要、オフライン、ゼロレイテンシ。
これはもはや究極のエッジコンピューティングである。
遮蔽物の認識(Occlusion)
次は、AIが最も苦手とする領域。
カレーの下に埋もれた具材。
オクラの影に隠れたゆで卵。
ソースの海に沈んだイカの足。
視覚情報だけでは、検出は極めて難しい。
AIはピクセルから推論する。
見えないものは、基本的に存在しない。
アネは違う。
彼は、盛り上がり方を見る。
重量感を見る。
過去数万皿分の記憶から、「この膨らみは卵だ」と推定する。
さらに困れば、実装済みのAPIを使う。
「これ何?」
音声入力だ。
人間相手なら、この手段が使える。
判定は引き分け、あるいはアネの辛勝。
人間は、視覚だけで戦わない。
コストパフォーマンス(Energy Efficiency)
では、コストはどうか。
AI側は重い。
GPU、サーバー、冷却、電力。
見えないところで大量のエネルギーを消費している。
一方、アネの燃料は単純だ。
朝のテタリ(Teh Tarik)一杯と、ロティチャナイ。
これだけで、昼過ぎまで高精度推論を継続する。
判定は圧勝。
アネは、極めてサステナブルな演算装置である。
説明可能性(Explainability)
AIは説明できる。
「鶏肉5RM、オクラ1RM、卵1RM。合計7RM」
正確で、透明で、誰に対しても同じだ。
アネは説明しない。
説明できない。
計算ロジックは、完全なブラックボックスだ。
安い時もあれば、高い時もある。
常連補正。
機嫌係数。
外国人観光客への動的価格設定。
どれもログには残らない。
しかし、この揺らぎこそが、ナシカンダーの一部でもある。
AIには実装できない「裁量」
画像認識の精度だけなら、AIはいずれ追いつくだろう。
遮蔽物も、ソースも、いずれ克服する。
それでも、アネには勝てない。
理由は単純だ。
彼は裁量(Discretion)を持っている。
同じ皿でも、
相手が誰かで、値段を変える。
それは不正確で、非効率で、非論理的だ。
しかし、その曖昧さが、店と客をつなぎ止める。
ナシカンダーの会計は、計算ではない。
人間関係というアルゴリズムだ。
ここは、まだ人間の領分であり続ける。
コメント