TR-MRV-Bench — a public per-facility emissions benchmark for Turkish CBAM-scope industry, with a closed-form physics baseline that reduces per-plant log-MAE by 82.3% vs the EU CBAM default, measured leave-one-plant-out over n=19 validatable plants.

TR-MRV-Bench — Türkiye CBAM-kapsamlı sanayi için kamuya açık, tesis-bazlı emisyon veri seti; AB varsayım değerine karşı tesis-bazlı log-MAE'yi birini-dışarıda-bırak ölçümünde %82.3 azaltan kapalı-form bir fizik formülüyle birlikte (n=19 doğrulanabilir tesis).

Ahmet Baris Gunaydin (sole author for v0). Open bench · audit-grade strong labels · cf-corrected formula baseline · Apache-2.0.

Ahmet Barış Günaydın (v0 tek yazarı). Açık veri seti · denetim-düzeyi güçlü etiketler · cf-düzeltilmiş formül temel modeli · Apache-2.0.

Abstract

Özet

CBAM and emerging emissions-trading regimes require per-facility CO₂ accounting that is independently verifiable. Independent estimators have known gaps: Climate TRACE (satellite + bottom-up) under-reports 4 of 5 audit-matched Turkish facilities (mean bias −17%); GHGSat / Carbon Mapper focus on methane with no CBAM tie-in. Calculation engines (Persefoni, CarbonChain) are activity-based and require operator data inputs — not comparable to an arms-length verification baseline. We release TR-MRV-Bench, a public benchmark of 59 Turkish CBAM-scope facilities with three-tier supervision (21 audit-grade strong labels across all four CBAM scopes — cement, steel, aluminum, fertilizer — from operator IARs and sustainability statements (GRI for pre-2024 disclosures; TSRS-compliant for CY 2024 onwards per the KGK mandate effective 1 January 2024) along with ISO 14064-1 audit reports issued by TÜRKAK-accredited verifiers (and, for sustainability-statement assurance, KGK-accredited audit firms); 7 Climate TRACE per-asset labels; capacity-factor-corrected default labels for the rest). On this bench we evaluate a closed-form physics baseline — capacity × emission-factor × capacity-factor, with route-aware EF priorities and cf priorities defined in §3 — and find it reduces per-plant log-MAE by 82.3% vs the EU CBAM default measured leave-one-plant-out (each plant's emission-factor derived only from the other audit plants in its route, so no plant sees its own answer) over the n=19 validatable plants. Two of the 21 audit-grade plants — BAGFAŞ (N₂O-controlled fertilizer) and Gübretaş (blender) — are each the sole plant of their route and cannot be validated leave-one-plant-out, so they are excluded from the headline. The in-sample fit (EF fitted on all plants, no hold-out) reaches +85.7%; the honest no-peeking number is +82.3%. Ridge regression on the same features lags the formula (it overfits the noisy S5P NO₂ features). iz, an in-browser WebGPU neural net, is an engineering demo, not a result: at n=21 it does not beat the closed-form formula. The actionable artifacts are the bench, the formula, and the source-cited disclosure crawl. n=19 is still small; we report variance bands and discuss what would and would not generalize in §8.

CBAM ve gelişmekte olan emisyon-ticaret rejimleri, bağımsızca doğrulanabilir tesis-bazlı CO₂ muhasebesi gerektiriyor. Bağımsız tahmincilerin bilinen eksikleri var: Climate TRACE (uydu + bottom-up) denetimle eşlenen 5 Türk tesisinden 4'ünü olduğundan düşük raporluyor (ortalama yanlılık −%17); GHGSat / Carbon Mapper metana odaklı, CBAM bağı yok. Hesaplama motorları (Persefoni, CarbonChain) faaliyet tabanlıdır ve operatör girdisi gerektirir — bağımsız bir doğrulama temel modeliyle kıyaslanamaz. TR-MRV-Bench'i yayımlıyoruz: 59 Türk CBAM-kapsamlı tesisin kamuya açık veri seti, üç-katmanlı denetim ile (21 denetim-düzeyi güçlü etiket; dört CBAM sektörü — çimento, çelik, alüminyum, gübre — operatör Entegre Yıllık Faaliyet Raporları ve sürdürülebilirlik beyanları (CY 2024 öncesi GRI; 1 Ocak 2024 itibarıyla geçerli KGK mandatı uyarınca CY 2024+ TSRS-uyumlu) ile TÜRKAK-akredite doğrulayıcıların ISO 14064-1 denetim raporlarından (sürdürülebilirlik-beyanı güvencesi için KGK-akredite denetim firmaları); 7 Climate TRACE tesis-bazlı etiket; geri kalan için cf-düzeltilmiş varsayım etiketleri). Bu veri seti üzerinde kapalı-form fizik temel modelini değerlendiriyoruz — kapasite × emisyon-faktörü × kullanım-faktörü, §3'te tanımlanan rota-duyarlı EF ve cf öncelikleriyle — ve tesis-bazlı log-MAE'yi AB CBAM varsayım değerine karşı %82.3 azalttığını buluyoruz — birini-dışarıda-bırak ölçümüyle (her tesisin emisyon-faktörü yalnızca aynı rotadaki diğer denetim tesislerinden türetilir; hiçbir tesis kendi cevabını görmez), n=19 doğrulanabilir tesis üzerinde. 21 denetim-düzeyi tesisin ikisi — BAGFAŞ (N₂O-kontrollü gübre) ve Gübretaş (harmancı) — kendi rotasının tek tesisi olduğu için birini-dışarıda-bırak ile doğrulanamaz ve ana sonuçtan hariç tutulur. Örneklem-içi uyum (EF tüm tesislere uydurulmuş, hold-out yok) +%85.7'ye ulaşır; dürüst, kopya-çekmeyen değer +%82.3'tür. Aynı özellikler üzerindeki Ridge regresyon formülün gerisinde kalıyor (gürültülü S5P NO₂ özelliklerine fazla uyum sağlıyor). iz, tarayıcı-içi WebGPU sinir ağı, bir mühendislik demosudur, sonuç değildir: n=21'de kapalı-form formülü geçmez. Eyleme dönük çıktılar veri seti, formül ve kaynaklı açıklama derlemesidir. n=19 hâlâ küçük; varyans bantlarını §8'de raporluyoruz.

Headline (leave-one-plant-out, n=19, all 4 CBAM scopes)

Ana sonuç (birini-dışarıda-bırak, n=19, 4 CBAM sektörü)

82.3%

Closed-form physics formula log-MAE reduction vs the EU CBAM default, leave-one-plant-out over the n=19 validatable plants — the actionable shipped baseline. The in-sample fit (no hold-out) reaches +85.7%; the honest no-peeking number is +82.3%. Ridge regression lags the formula. iz (the in-browser WebGPU net) is a demo, not a result, and does not beat the formula at n=21.

Kapalı-form fizik formülünün AB CBAM varsayımına karşı log-MAE azaltımı, n=19 doğrulanabilir tesiste birini-dışarıda-bırak — yayımlanan eyleme dönük temel. Örneklem-içi uyum (hold-out yok) +%85.7'ye ulaşır; dürüst, kopya-çekmeyen değer +%82.3'tür. Ridge regresyon formülün gerisinde. iz (tarayıcı-içi WebGPU ağı) bir demodur, sonuç değildir ve n=21'de formülü geçmez.

What actually ships

Neyi yayımlıyoruz

a 59-facility public bench, a closed-form route-aware cap × EF × cf formula, and a citeable disclosure crawl across cement / steel / aluminum / fertilizer. Not a foundation model. iz, the in-browser WebGPU net, is a separate engineering demo — not part of the result.

59-tesislik kamuya açık veri seti, rota-duyarlı kapalı-form kap × EF × cf formülü ve çimento / çelik / alüminyum / gübre boyunca kaynaklı açıklama derlemesi. Temel-model değildir. iz, tarayıcı-içi WebGPU ağı, ayrı bir mühendislik demosudur — sonucun parçası değil.

Table 0 — Baseline comparison (the headline result)

Tablo 0 — Temel karşılaştırma (ana sonuç)

Baseline	Temel model	log-MAE	Reduction vs EU	AB'ye karşı azalma	What it is
B0 — EU CBAM default	1.432	0.0%	`capacity × EU_default_EF` (cement 1.584, steel 1.9, Al 1.5, fertilizer 0.8)	`kapasite × AB_varsayım_EF` (çimento 1.584, çelik 1.9, Al 1.5, gübre 0.8)
B3 — Climate TRACE (n=5 audit-matched)(n=5 denetim eşli)	—	mean bias −17%	ort. yanlılık −%17	CT's per-asset CO₂ estimate, taken at face value	CT'nin tesis-bazlı CO₂ tahmini, birebir alınmış
B2 — Ridge regression / Ridge regresyon	0.266	+81.4%	Linear ML on the same 18 features, residuals against B1	Aynı 18 özellik üzerinde doğrusal makine öğrenmesi, B1'e karşı artıklar
B1 — cf-corrected formula (headline)B1 — cf-düzeltilmiş formül (ana sonuç)	0.206	+82.3%	`capacity × route-EF × cf` — closed form, no learned parameters, leave-one-plant-out over n=19; the actionable shipped baseline. Reduction is vs the EU default on the same 19 plants (EU log-MAE 1.166, since 2 plants are held out). In-sample (leaky) fit = +85.7%.	`kapasite × rota-EF × cf` — kapalı form, öğrenilmiş parametre yok, n=19'da birini-dışarıda-bırak; yayımlanan eyleme dönük temel. Azaltım aynı 19 tesiste AB varsayımına karşıdır (AB log-MAE 1.166, 2 tesis dışarıda). Örneklem-içi (kopyalı) uyum = +%85.7.

Leave-one-plant-out over the n=19 validatable plants, across all 4 CBAM scopes. The closed-form formula is the shipped baseline. Ridge regression underperforms it — without the physics prior, it overfits 18 features on a handful of samples. iz, the in-browser WebGPU net, is an engineering demo and at n=21 does not beat the formula, so it is not shown here as a result.

4 CBAM sektörünün tümünde n=19 doğrulanabilir tesiste birini-dışarıda-bırak. Yayımlanan temel kapalı-form formüldür. Ridge regresyon onun gerisinde — fizik öncel olmadan, 18 özelliği bir avuç örneğe fazla uyum sağlıyor. iz, tarayıcı-içi WebGPU ağı, bir mühendislik demosudur ve n=21'de formülü geçmez; bu yüzden burada bir sonuç olarak gösterilmez.

Figure 1 — Per-plant predictions vs EU CBAM default

Şekil 1 — Tesis-bazlı tahminler ve AB CBAM varsayımı

Each pair of bars is one held-out facility. Light red = EU CBAM default. Green = leave-one-plant-out prediction (median). Black tick = audit-grade disclosed Scope 1 truth. log-y. Bars sorted by truth ascending. The shipped result is the closed-form formula (+82.3%, n=19); iz, the in-browser WebGPU net, is an engineering demo shown for illustration only and is not part of the result.

Her bir çubuk çifti tek bir dışarıda-bırakılmış tesisi gösterir. Açık kırmızı = AB CBAM varsayımı. Yeşil = birini-dışarıda-bırak tahmini (medyan). Siyah işaret = denetim-düzeyi beyan edilen Kapsam 1 gerçek değer. log-y. Çubuklar gerçek değere göre artan sırada. Yayımlanan sonuç kapalı-form formüldür (+%82.3, n=19); iz, tarayıcı-içi WebGPU ağı, yalnızca gösterim amaçlı bir mühendislik demosudur ve sonucun parçası değildir.

Table 1 — Leave-one-plant-out predictions

Tablo 1 — Birini-dışarıda-bırak tahminleri

The headline is the cf-corrected formula at +82.3% log-MAE reduction vs the EU CBAM default, leave-one-plant-out over the n=19 validatable plants. The last two rows — BAGFAŞ (sole N₂O-controlled fertilizer plant) and Gübretaş (sole blender) — are each the only plant of their route, cannot be validated leave-one-plant-out, and are excluded from the headline. The prediction column below is the formula's leave-one-plant-out estimate, not a learned model.

Ana sonuç, AB CBAM varsayımına karşı %82.3 log-MAE azaltan cf-düzeltilmiş formüldür; n=19 doğrulanabilir tesiste birini-dışarıda-bırak. Son iki satır — BAGFAŞ (tek N₂O-kontrollü gübre tesisi) ve Gübretaş (tek harmancı) — kendi rotasının tek tesisi olduğu için birini-dışarıda-bırak ile doğrulanamaz ve ana sonuçtan hariç tutulur. Aşağıdaki tahmin sütunu formülün birini-dışarıda-bırak tahminidir, öğrenilmiş bir model değil.

Facility	Tesis	Sector / route	Sektör / rota	Truth (tCO₂/yr)	Gerçek (tCO₂/yıl)	formula (LOPO)	formül (LOPO)
Afyon Çimento	cement	çimento	1,200,000	707,218	0.59×	2,851,200	-75%
Akçansa Büyükçekmece	cement · allocated	çimento · tahsis edilmiş	1,514,000	1,791,305	1.18×	3,960,000	-55%
Akçansa Çanakkale	cement · allocated	çimento · tahsis edilmiş	3,466,000	3,865,919	1.12×	8,712,000	-56%
Akçansa Ladik	cement · allocated	çimento · tahsis edilmiş	499,000	593,874	1.19×	1,584,000	-63%
Batısöke Söke	cement	çimento	1,577,926	1,414,694	0.90×	6,336,000	-78%
Bursa Çimento	cement	çimento	1,121,545	707,347	0.63×	3,168,000	-78%
Göltaş Isparta	cement	çimento	1,669,072	1,972,408	1.18×	7,920,000	-75%
Nuh Hereke	cement	çimento	3,584,953	2,466,776	0.69×	9,028,800	-73%
Çolakoğlu Gebze	steel · EAF	566,519	539,539	0.95×	8,550,000	-94%
Habaş Aliağa	steel · EAF	830,338	842,538	1.01×	8,550,000	-90%
İzdemir Aliağa	steel · EAF	271,123	280,735	1.04×	2,850,000	-90%
Erdemir Ereğli	steel · BF/BOF	6,667,232	7,288,906	1.09×	7,600,000	-4%
İsdemir İskenderun	steel · BF/BOF	10,663,364	11,167,535	1.05×	10,070,000	+11%
Kardemir Karabük	steel · BF/BOF	5,650,626	4,957,336	0.88×	6,650,000	-25%
Assan Tuzla	aluminum · downstream	alüminyum · aşağı akış	108,500	92,416	0.85×	540,000	-83%
ASAŞ Akyazı	aluminum · downstream	alüminyum · aşağı akış	68,618	80,560	1.17×	375,000	-79%
Toros Mersin	fertilizer · integrated · allocated	gübre · entegre · tahsis edilmiş	383,150	280,204	0.73×	648,000	-57%
Toros Samsun	fertilizer · integrated · allocated	gübre · entegre · tahsis edilmiş	255,180	207,315	0.81×	460,000	-55%
Toros Ceyhan	fertilizer · integrated · allocated	gübre · entegre · tahsis edilmiş	203,840	376,674	1.85×	657,360	-43%
BAGFAŞ Bandırma — single-plant, not validatable (excluded from headline)— tek tesis, doğrulanamaz (ana sonuçtan hariç)	fertilizer · N₂O-controlled	gübre · N₂O-kontrollü	9,828	17,465	1.78×	560,000	-97%
Gübretaş Yarımca — single-plant, not validatable (excluded from headline)— tek tesis, doğrulanamaz (ana sonuçtan hariç)	fertilizer · blender	gübre · harmancı	13,281	15,100	1.14×	640,000	-98%

Big-emitter predictions (Erdemir, İsdemir, Kardemir, Çolakoğlu, Akçansa Çanakkale, Batısöke) land within ±30% of audit. BAGFAŞ (1.78×) is the only N₂O-controlled facility in our disclosure set and Gübretaş the only blender, so under leave-one-plant-out neither has an in-route peer to derive an EF from — both fall back to sector defaults and are excluded from the headline (n=19). The cement under-predictions (Afyon 0.59×, Bursa 0.63×, Nuh 0.69×) run above the sector-default capacity factor, which the formula prior can't infer without disclosed cf.

Büyük emitör tahminleri (Erdemir, İsdemir, Kardemir, Çolakoğlu, Akçansa Çanakkale, Batısöke) denetimin ±%30 sınırında. BAGFAŞ (1.78×) açıklama setimizdeki tek N₂O-kontrollü tesis, Gübretaş ise tek harmancı; bu yüzden birini-dışarıda-bırak altında ikisinin de EF türetilecek aynı-rotada eşi yok — ikisi de sektör varsayımına geri dönüyor ve ana sonuçtan hariç tutuluyor (n=19). Çimento düşük-tahminleri (Afyon 0.59×, Bursa 0.63×, Nuh 0.69×) sektör-varsayımı kapasite faktörünün üstünde çalışıyor; formül beyanlı cf olmadan bunu bilemez.

External validity — Verifier B6 (372 EU cement installations)

Dış geçerlilik — Doğrulayıcı B6 (372 AB çimento tesisi)

The strongest evidence that the closed-form formula generalizes beyond the n=19 Turkish set is Verifier B6: the same capacity × route-EF × cf formula applied to 372 EU cement installations whose emissions are EUTL third-party-verified gives a median predicted/verified ratio ≈ 1.0, against the EU CBAM default's ≈ 2.5×. These are independent, third-party-verified labels — not operator self-reports — so B6 directly addresses the "audit-grade ≠ third-party-verified" caveat below.

Kapalı-form formülün n=19'luk Türkiye setinin ötesine genellendiğine dair en güçlü kanıt Doğrulayıcı B6'dır: aynı kapasite × rota-EF × cf formülü, emisyonları EUTL üçüncü-taraf-doğrulu olan 372 AB çimento tesisine uygulandığında tahmin/doğrulanmış medyan oranı ≈ 1.0 verir; AB CBAM varsayımının ≈ 2.5×'ine karşı. Bunlar bağımsız, üçüncü-taraf-doğrulu etiketlerdir — operatör beyanı değil — bu yüzden B6, aşağıdaki "denetim-düzeyi ≠ üçüncü-taraf-doğrulu" uyarısını doğrudan giderir.

Contributions

Katkılar

TR-MRV-Bench — 59-facility public per-facility emissions benchmark with three-tier supervision (21 audit-grade strong labels across all four CBAM sectors, 7 Climate TRACE per-asset labels, capacity-factor-corrected default labels for the remainder). Stratified train/val/test split by (scope × route) with route refinements per sector: steel (BF/BOF, EAF, DRI-EAF), aluminum (primary, downstream), fertilizer (integrated, integrated-n2o-controlled, blender). Provenance per label: direct (14), allocated (6), composite (1).
cf-corrected formula as a strong baseline — capacity × EF × cf with EF priority route-specific (steel/Al/fertilizer) > company-specific > sector-mean and cf priority CT per-asset > disclosed-production-ratio > sector-mean. On the n=19 leave-one-plant-out eval this formula reduces log-MAE by 82.3% vs the EU CBAM default — the actionable shipped baseline (in-sample, leaky fit = +85.7%). Leave-one-plant-out per-facility ratios: Erdemir Ereğli 1.09× truth, İsdemir 1.05×, Akçansa Çanakkale 1.12×, Batısöke 0.90×, Çolakoğlu 0.95×.
EU-default headroom is sector-asymmetric — The EU default over-estimates by 2-5× for cement and 5-10× for EAF steel, but is within 5% of audited truth for big BF/BOF integrated mills (İsdemir 10.07M EU vs 10.66M actual). The improvement is concentrated in cement and EAF; BF/BOF integrated steel sees structural limits.
Climate TRACE systematically under-reports TR integrated steel — Across our three BF/BOF mills (Erdemir, İsdemir, Kardemir) CT estimates run 20-30% below disclosed audited Scope 1. Using CT-derived capacity-factors worsens accuracy because CT cf is computed from these under-reported emissions, so the formula uses operator-disclosed cf and excludes CT (CT features are neutral-to-negative at n=19).
iz is an in-browser demo, not a result — A 2-layer LoRA-shaped MLP (18 features, browser-native WebGPU) ships as an engineering demo. At n=21 it does not beat the closed-form formula, so it is not part of the headline; it is a candidate for v1 once the bench scales to the ~800 EUTL plant-labels. Ridge regression on the same features lags the formula at 81.4%. Future work should focus on data growth (more disclosures, satellite features) before parameter growth.

TR-MRV-Bench — 59-tesislik kamuya açık, tesis-bazlı emisyon veri seti; üç-katmanlı denetim (4 CBAM sektörü genelinde 21 denetim-düzeyi güçlü etiket; 7 Climate TRACE tesis-bazlı etiket; geri kalan için cf-düzeltilmiş varsayım etiketleri). (sektör × rota) ile katmanlı eğitim/doğrulama/test bölünmesi; sektör başına rota inceltmeleri: çelik (YF/BOF, EAF, DRI-EAF), alüminyum (birincil, aşağı akış), gübre (entegre, entegre-N₂O-kontrollü, harmancı). Etiket kaynağı: doğrudan (14), tahsis edilmiş (6), bileşik (1).
Güçlü temel olarak cf-düzeltilmiş formül — kapasite × EF × cf; EF önceliği rota-bazlı (çelik/Al/gübre) > şirket-bazlı > sektör-ortalama; cf önceliği CT tesis-bazlı > beyan edilmiş üretim-oranı > sektör-ortalama. n=19 birini-dışarıda-bırak değerlendirmesinde bu formül AB CBAM varsayımına karşı log-MAE'yi %82.3 azaltıyor — yayımlanan eyleme dönük temel (örneklem-içi, kopyalı uyum = +%85.7). Birini-dışarıda-bırak tesis-bazlı oranlar: Erdemir Ereğli 1.09× gerçek, İsdemir 1.05×, Akçansa Çanakkale 1.12×, Batısöke 0.90×, Çolakoğlu 0.95×.
AB-varsayım marjı sektöre göre asimetriktir — AB varsayımı çimentoyu 2-5×, EAF çeliğini 5-10× abartıyor, ama büyük YF/BOF entegre tesislerinin denetim gerçeğine %5 dahilinde (İsdemir AB 10.07M ↔ gerçek 10.66M). İyileştirme çimento ve EAF'ta yoğunlaşıyor; YF/BOF entegre çelikte yapısal sınırlar var.
Climate TRACE TR entegre çeliğini sistematik olarak düşük raporluyor — Üç YF/BOF tesisimizde (Erdemir, İsdemir, Kardemir) CT tahminleri beyan edilen denetim-düzeyi Kapsam 1'in %20-30 altında. CT-türevi kullanım-faktörleri doğruluğu kötüleştiriyor çünkü CT cf bu eksik raporlanmış emisyonlardan hesaplanıyor; bu yüzden formül operatör-beyanlı cf kullanır ve CT'yi dışlar (n=19'da CT özellikleri nötr-negatif).
iz bir tarayıcı-içi demodur, sonuç değildir — 2-katmanlı LoRA-biçimli MLP (18 özellik, tarayıcı-yerli WebGPU) bir mühendislik demosu olarak yayımlanıyor. n=21'de kapalı-form formülü geçmiyor, bu yüzden ana sonucun parçası değil; veri seti ~800 EUTL tesis-etiketine ölçeklendiğinde v1 için bir aday. Ridge regresyon aynı özelliklerde formülün gerisinde, %81.4. Gelecek çalışma parametre büyütme yerine veri büyütmeye odaklanmalı (daha fazla beyan, uydu özellikleri).

What works (cf-corrected formula B1)

Ne işe yarıyor (cf-düzeltilmiş formül B1)

14 of 19 validatable plants land within ±20% of audited Scope 1 truth using the closed-form formula, leave-one-plant-out.
EAF steel (n=3): Çolakoğlu 0.95×, Habaş 1.01×, İzdemir 1.04× — all within ±5% of audited truth, leave-one-plant-out, ~90% below the EU default.
BF/BOF steel (n=3, all TR integrated mills): Erdemir 1.09×, İsdemir 1.05×, Kardemir 0.88× — all within ±12%.
Cement (n=8): 5 of 8 plants land within ±20% (Çanakkale 1.12×, Göltaş 1.18×, Büyükçekmece 1.18×, Ladik 1.19×, Batısöke 0.90×).
Aluminium downstream (n=2): Assan 0.85×, ASAŞ 1.17× — the formula separates downstream rolling (0.45 t/t) from the EU primary-smelting default.

19 doğrulanabilir tesisin 14'ü kapalı-form formül ile birini-dışarıda-bırak, denetim-düzeyi Kapsam 1 gerçeğinin ±%20 sınırında.
EAF çelik (n=3): Çolakoğlu 0.95×, Habaş 1.01×, İzdemir 1.04× — hepsi birini-dışarıda-bırak ile denetim gerçeğinin ±%5 sınırında, AB varsayımının ~%90 altında.
YF/BOF çelik (n=3, tüm TR entegre tesisleri): Erdemir 1.09×, İsdemir 1.05×, Kardemir 0.88× — hepsi ±%12 içinde.
Çimento (n=8): 8 tesisin 5'i ±%20 içinde (Çanakkale 1.12×, Göltaş 1.18×, Büyükçekmece 1.18×, Ladik 1.19×, Batısöke 0.90×).
Alüminyum aşağı akış (n=2): Assan 0.85×, ASAŞ 1.17× — formül haddehaneyi (0.45 t/t) AB birincil-eritme varsayımından ayırıyor.

What doesn't (yet)

Ne henüz çalışmıyor

n=19 validatable is still small. Wider than the original n=8 cement+steel test set. Two single-instance route strata (BAGFAŞ N₂O-controlled, Gübretaş blender) have no in-route peer under leave-one-plant-out — by design they fall back to sector defaults, so they are excluded from the headline, leaving n=19 of the 21 audit-grade plants.
The shipped baseline is the closed-form formula (+82.3% leave-one-plant-out, n=19). iz, the in-browser WebGPU net, is an engineering demo, not part of the result — at n=21 it does not beat the formula.
BF/BOF integrated steel is structurally hard. TR has only 3 BF/BOF mills (Erdemir, İsdemir, Kardemir) and EU CBAM default 1.9 t/t happens to be close to TR audited reality (1.97-2.40 t/t). The formula matches but does not meaningfully beat EU default on this stratum.
Capacity-factor variance is the dominant residual. The cement under-predictions — Afyon 0.59×, Bursa 0.63×, Nuh 0.69× — run at actual capacity factors above the sector default, which the formula prior can't infer without a disclosed cf. Honest leave-one-plant-out behavior, not a bug.
Akçansa and Toros per-plant labels are allocated. Akçansa group total split by clinker share; Toros Tarım group 842k split across Mersin/Samsun/Ceyhan by nameplate capacity.
No satellite signal in v0. S5P NO₂ pipeline exists but didn't make it into the model. The "Earth-observation foundation model" framing from earlier drafts is dropped from this version.
Operator-self-reported truths. Audit-grade ≠ third-party-verified. Our strong labels come from operator IARs and sustainability statements (GRI pre-2024; TSRS post-2024 per KGK mandate effective 1 January 2024); ISO 14064-1 verified by TÜRKAK-accredited verifiers for Habaş, Batısöke, Bursa, Afyon; mostly Big4-audited for sustainability-statement assurance.

n=19 doğrulanabilir hâlâ küçük. Orijinal n=8 çimento+çelik test setinden geniş. İki tek-örnekli rota katmanı (BAGFAŞ N₂O-kontrollü, Gübretaş harmancı) birini-dışarıda-bırak altında aynı-rotada eşi yok — tasarım gereği sektör varsayımına geri dönüyorlar, bu yüzden ana sonuçtan hariç tutuluyor ve 21 denetim-düzeyi tesisin n=19'u kalıyor.
Yayımlanan temel kapalı-form formüldür (+%82.3 birini-dışarıda-bırak, n=19). iz, tarayıcı-içi WebGPU ağı, bir mühendislik demosudur, sonucun parçası değil — n=21'de formülü geçmez.
YF/BOF entegre çelik yapısal olarak zor. TR'de sadece 3 YF/BOF tesisi var (Erdemir, İsdemir, Kardemir) ve AB CBAM varsayım değeri 1.9 t/t, TR denetim gerçeğine (1.97-2.40 t/t) yakın. Formül eşleşiyor ama bu katmanda AB varsayımını anlamlı biçimde geçmiyor.
Kapasite-faktörü varyansı ana artıktır. Çimento düşük-tahminleri — Afyon 0.59×, Bursa 0.63×, Nuh 0.69× — sektör varsayımının üstünde gerçek kapasite faktörleriyle çalışıyor; formül öncel beyan edilmiş cf olmadan bunu bilemez. Hata değil, dürüst birini-dışarıda-bırak davranışı.
Akçansa ve Toros tesis-bazlı etiketleri tahsis edilmiş. Akçansa grup toplamı klinker payına göre bölündü; Toros Tarım grup 842k Mersin/Samsun/Ceyhan arasında plaka kapasitesine göre bölündü.
v0'da uydu sinyali yok. S5P NO₂ boru hattı mevcut ama modele girmedi. Önceki taslakların "Dünya gözlemi temel modeli" çerçevesi bu sürümde düşürüldü.
Operatör beyanları. Denetim-düzeyi ≠ üçüncü-taraf doğrulu. Güçlü etiketlerimiz operatör Entegre Yıllık Faaliyet Raporları ve sürdürülebilirlik beyanlarından (1 Ocak 2024 itibarıyla geçerli KGK mandatı uyarınca CY 2024 öncesi GRI, sonrası TSRS-uyumlu); Batısöke, Nuh, BAGFAŞ için TÜRKAK-akredite doğrulayıcılar ISO 14064-1 doğrulamış; sürdürülebilirlik beyanı güvencesi çoğunlukla Big4-denetli.

Section 6 — Ablations

Bölüm 6 — Ablasyonlar

9-variant feature ablation matrix on the leave-one-plant-out eval (n=19). What each design choice contributes to the full-feature model's reduction of +82.4% (in line with the shipped closed-form formula's +82.3%). This is a feature-contribution study, not an iz-beats-the-formula claim:

Birini-dışarıda-bırak değerlendirmesinde (n=19) 9-varyantlı özellik ablasyon matrisi. Her tasarım seçiminin tam-özellikli modelin +%82.4 azaltımına katkısı (yayımlanan kapalı-form formülün +%82.3'üyle uyumlu). Bu bir özellik-katkı çalışmasıdır, iz'in formülü geçtiği iddiası değil:

Variant	Varyant	log-MAE	Reduction	Azalma	Δ vs full
full (route + disc + ct + prior + sat)tam (rota + beyan + ct + öncel + uydu)	0.251	+82.4%	—	full model	tam model
no_prior	0.706	+50.7%	−31.7 pp	physics prior is the #1 contributor	fizik öncel #1 katkıcı
no_route	0.512	+64.2%	−18.2 pp	route-aware EFs (steel/Al/fertilizer)	rota-duyarlı EF'ler (çelik/Al/gübre)
no_disc	0.405	+71.7%	−10.7 pp	operator-disclosed cf	operatör-beyanlı cf
no_ct	0.252	+82.4%	~ 0	CT features are neutral at n=19	n=19'da CT özellikleri nötr
no_beirle	0.241	+83.2%	+0.8 pp	Beirle NOx slightly hurts	Beirle NOx hafifçe zarar veriyor
no_s5p	0.229	+84.0%	+1.6 pp	S5P NO₂ slightly hurts	S5P NO₂ hafifçe zarar veriyor
no_sat (both satellite off)no_sat (iki uydu da kapalı)	0.259	+81.9%	−0.5 pp	(within seed noise; satellites do not help)	(tohum gürültüsü içinde; uydular yardım etmiyor)
no_disc + no_route	0.561	+60.9%	−21.5 pp	minimum-feature lower bound	minimum-özellik alt sınır

N_OUTER=1 — small effects (≤2pp) are within seed noise; for stable CIs we'd need N_OUTER≥5. The clear conclusions: prior, route, disclosed-cf are the real signal carriers; CT and satellite features are net zero (or slightly negative) at this data scale. Same pattern as the CT-features-hurt finding from earlier — at n=19 with 15+ features, noisy auxiliary signals (CT cf computed from biased emissions; S5P NO₂ over individual plants) add variance without information.

N_OUTER=1 — küçük etkiler (≤2 puan) tohum gürültüsü içinde; kararlı CI'ler için N_OUTER≥5 gerekir. Açık sonuçlar: öncel, rota, beyanlı-cf gerçek sinyal taşıyıcıları; CT ve uydu özellikleri bu veri ölçeğinde net sıfır (veya hafif negatif). Önceki "CT özellikleri zarar veriyor" bulgusuyla aynı kalıp — n=19'da 15+ özellikle, gürültülü yardımcı sinyaller (yanlı emisyonlardan hesaplanan CT cf; tek tesis üzerindeki S5P NO₂) bilgi katmadan varyans ekliyor.

The full feature-ablation harness (the neural-net variant that produced these deltas) lives in the iz-lab repo; the table above is the honest summary.

Tam özellik-ablasyon aracı (bu farkları üreten sinir-ağı varyantı) iz-lab deposunda; yukarıdaki tablo dürüst özettir.

Path to v1

v1'e giden yol

Sentinel-5P NO₂ bbox features for all 59 facilities (pipeline running; full pull blocked by Planetary Computer rate limits).
Sentinel-2 RGB+NIR for plant footprint detection (yard activity ≈ production proxy).
Landsat / Sentinel-3 SLSTR thermal over kiln/furnace centroid.
Disclosed-cf feature for all facilities without CT match (back-computed from production tonnes in IAR).
Federated .flora adapter format — one operator runs LoRA fine-tuning on its own CEMS data, ships only the rank-16 adapter.
Ternary QAT (BitNet b1.58 style) on the multi-modal backbone, knowledge-distilled from the v1 fp16 teacher.

Tüm 59 tesis için Sentinel-5P NO₂ bbox özellikleri (boru hattı çalışıyor; tam çekim Planetary Computer kotalarıyla bloklu).
Sentinel-2 RGB+NIR ile tesis ayak izi tespiti (saha aktivitesi ≈ üretim vekili).
Landsat / Sentinel-3 SLSTR ile fırın/yatak merkezi termal görüntüleme.
CT eşleşmesi olmayan tüm tesisler için beyanlı-cf özelliği (Entegre Yıllık Faaliyet Raporu'ndaki üretim tonlarından geriye-hesap).
Federe .flora adaptör formatı — bir operatör kendi CEMS verisi üzerinde LoRA ince-ayar yapıyor, sadece rank-16 adaptörü gönderiyor.
Çok-modlu omurgada ternary QAT (BitNet b1.58 tarzı), v1 fp16 öğretmenden bilgi-damıtmalı.