iz · TR-MRV-Bench · v0.4 · 2026-05-29

TR-MRV-Bench — a public per-facility emissions benchmark for Turkish CBAM-scope industry, with a closed-form physics baseline that reduces per-plant log-MAE by 82.3% vs the EU CBAM default, measured leave-one-plant-out over n=19 validatable plants.

TR-MRV-Bench — Türkiye CBAM-kapsamlı sanayi için kamuya açık, tesis-bazlı emisyon veri seti; AB varsayım değerine karşı tesis-bazlı log-MAE'yi birini-dışarıda-bırak ölçümünde %82.3 azaltan kapalı-form bir fizik formülüyle birlikte (n=19 doğrulanabilir tesis).

Abstract

Özet

CBAM and emerging emissions-trading regimes require per-facility CO₂ accounting that is independently verifiable. Independent estimators have known gaps: Climate TRACE (satellite + bottom-up) under-reports 4 of 5 audit-matched Turkish facilities (mean bias −17%); GHGSat / Carbon Mapper focus on methane with no CBAM tie-in. Calculation engines (Persefoni, CarbonChain) are activity-based and require operator data inputs — not comparable to an arms-length verification baseline. We release TR-MRV-Bench, a public benchmark of 59 Turkish CBAM-scope facilities with three-tier supervision (21 audit-grade strong labels across all four CBAM scopes — cement, steel, aluminum, fertilizer — from operator IARs and sustainability statements (GRI for pre-2024 disclosures; TSRS-compliant for CY 2024 onwards per the KGK mandate effective 1 January 2024) along with ISO 14064-1 audit reports issued by TÜRKAK-accredited verifiers (and, for sustainability-statement assurance, KGK-accredited audit firms); 7 Climate TRACE per-asset labels; capacity-factor-corrected default labels for the rest). On this bench we evaluate a closed-form physics baseline — capacity × emission-factor × capacity-factor, with route-aware EF priorities and cf priorities defined in §3 — and find it reduces per-plant log-MAE by 82.3% vs the EU CBAM default measured leave-one-plant-out (each plant's emission-factor derived only from the other audit plants in its route, so no plant sees its own answer) over the n=19 validatable plants. Two of the 21 audit-grade plants — BAGFAŞ (N₂O-controlled fertilizer) and Gübretaş (blender) — are each the sole plant of their route and cannot be validated leave-one-plant-out, so they are excluded from the headline. The in-sample fit (EF fitted on all plants, no hold-out) reaches +85.7%; the honest no-peeking number is +82.3%. Ridge regression on the same features lags the formula (it overfits the noisy S5P NO₂ features). iz, an in-browser WebGPU neural net, is an engineering demo, not a result: at n=21 it does not beat the closed-form formula. The actionable artifacts are the bench, the formula, and the source-cited disclosure crawl. n=19 is still small; we report variance bands and discuss what would and would not generalize in §8.

CBAM ve gelişmekte olan emisyon-ticaret rejimleri, bağımsızca doğrulanabilir tesis-bazlı CO₂ muhasebesi gerektiriyor. Bağımsız tahmincilerin bilinen eksikleri var: Climate TRACE (uydu + bottom-up) denetimle eşlenen 5 Türk tesisinden 4'ünü olduğundan düşük raporluyor (ortalama yanlılık −%17); GHGSat / Carbon Mapper metana odaklı, CBAM bağı yok. Hesaplama motorları (Persefoni, CarbonChain) faaliyet tabanlıdır ve operatör girdisi gerektirir — bağımsız bir doğrulama temel modeliyle kıyaslanamaz. TR-MRV-Bench'i yayımlıyoruz: 59 Türk CBAM-kapsamlı tesisin kamuya açık veri seti, üç-katmanlı denetim ile (21 denetim-düzeyi güçlü etiket; dört CBAM sektörü — çimento, çelik, alüminyum, gübre — operatör Entegre Yıllık Faaliyet Raporları ve sürdürülebilirlik beyanları (CY 2024 öncesi GRI; 1 Ocak 2024 itibarıyla geçerli KGK mandatı uyarınca CY 2024+ TSRS-uyumlu) ile TÜRKAK-akredite doğrulayıcıların ISO 14064-1 denetim raporlarından (sürdürülebilirlik-beyanı güvencesi için KGK-akredite denetim firmaları); 7 Climate TRACE tesis-bazlı etiket; geri kalan için cf-düzeltilmiş varsayım etiketleri). Bu veri seti üzerinde kapalı-form fizik temel modelini değerlendiriyoruz — kapasite × emisyon-faktörü × kullanım-faktörü, §3'te tanımlanan rota-duyarlı EF ve cf öncelikleriyle — ve tesis-bazlı log-MAE'yi AB CBAM varsayım değerine karşı %82.3 azalttığını buluyoruz — birini-dışarıda-bırak ölçümüyle (her tesisin emisyon-faktörü yalnızca aynı rotadaki diğer denetim tesislerinden türetilir; hiçbir tesis kendi cevabını görmez), n=19 doğrulanabilir tesis üzerinde. 21 denetim-düzeyi tesisin ikisi — BAGFAŞ (N₂O-kontrollü gübre) ve Gübretaş (harmancı) — kendi rotasının tek tesisi olduğu için birini-dışarıda-bırak ile doğrulanamaz ve ana sonuçtan hariç tutulur. Örneklem-içi uyum (EF tüm tesislere uydurulmuş, hold-out yok) +%85.7'ye ulaşır; dürüst, kopya-çekmeyen değer +%82.3'tür. Aynı özellikler üzerindeki Ridge regresyon formülün gerisinde kalıyor (gürültülü S5P NO₂ özelliklerine fazla uyum sağlıyor). iz, tarayıcı-içi WebGPU sinir ağı, bir mühendislik demosudur, sonuç değildir: n=21'de kapalı-form formülü geçmez. Eyleme dönük çıktılar veri seti, formül ve kaynaklı açıklama derlemesidir. n=19 hâlâ küçük; varyans bantlarını §8'de raporluyoruz.

Headline (leave-one-plant-out, n=19, all 4 CBAM scopes)

Ana sonuç (birini-dışarıda-bırak, n=19, 4 CBAM sektörü)

82.3%
Closed-form physics formula log-MAE reduction vs the EU CBAM default, leave-one-plant-out over the n=19 validatable plants — the actionable shipped baseline. The in-sample fit (no hold-out) reaches +85.7%; the honest no-peeking number is +82.3%. Ridge regression lags the formula. iz (the in-browser WebGPU net) is a demo, not a result, and does not beat the formula at n=21.
Kapalı-form fizik formülünün AB CBAM varsayımına karşı log-MAE azaltımı, n=19 doğrulanabilir tesiste birini-dışarıda-bırak — yayımlanan eyleme dönük temel. Örneklem-içi uyum (hold-out yok) +%85.7'ye ulaşır; dürüst, kopya-çekmeyen değer +%82.3'tür. Ridge regresyon formülün gerisinde. iz (tarayıcı-içi WebGPU ağı) bir demodur, sonuç değildir ve n=21'de formülü geçmez.

What actually ships

Neyi yayımlıyoruz

3
a 59-facility public bench, a closed-form route-aware cap × EF × cf formula, and a citeable disclosure crawl across cement / steel / aluminum / fertilizer. Not a foundation model. iz, the in-browser WebGPU net, is a separate engineering demo — not part of the result.
59-tesislik kamuya açık veri seti, rota-duyarlı kapalı-form kap × EF × cf formülü ve çimento / çelik / alüminyum / gübre boyunca kaynaklı açıklama derlemesi. Temel-model değildir. iz, tarayıcı-içi WebGPU ağı, ayrı bir mühendislik demosudur — sonucun parçası değil.

Table 0 — Baseline comparison (the headline result)

Tablo 0 — Temel karşılaştırma (ana sonuç)

BaselineTemel model log-MAE Reduction vs EUAB'ye karşı azalma What it isNedir
B0 — EU CBAM default1.4320.0% capacity × EU_default_EF (cement 1.584, steel 1.9, Al 1.5, fertilizer 0.8) kapasite × AB_varsayım_EF (çimento 1.584, çelik 1.9, Al 1.5, gübre 0.8)
B3 — Climate TRACE (n=5 audit-matched)(n=5 denetim eşli) mean bias −17%ort. yanlılık −%17 CT's per-asset CO₂ estimate, taken at face value CT'nin tesis-bazlı CO₂ tahmini, birebir alınmış
B2 — Ridge regression / Ridge regresyon0.266+81.4% Linear ML on the same 18 features, residuals against B1 Aynı 18 özellik üzerinde doğrusal makine öğrenmesi, B1'e karşı artıklar
B1 — cf-corrected formula (headline)B1 — cf-düzeltilmiş formül (ana sonuç) 0.206+82.3% capacity × route-EF × cf — closed form, no learned parameters, leave-one-plant-out over n=19; the actionable shipped baseline. Reduction is vs the EU default on the same 19 plants (EU log-MAE 1.166, since 2 plants are held out). In-sample (leaky) fit = +85.7%. kapasite × rota-EF × cf — kapalı form, öğrenilmiş parametre yok, n=19'da birini-dışarıda-bırak; yayımlanan eyleme dönük temel. Azaltım aynı 19 tesiste AB varsayımına karşıdır (AB log-MAE 1.166, 2 tesis dışarıda). Örneklem-içi (kopyalı) uyum = +%85.7.

Leave-one-plant-out over the n=19 validatable plants, across all 4 CBAM scopes. The closed-form formula is the shipped baseline. Ridge regression underperforms it — without the physics prior, it overfits 18 features on a handful of samples. iz, the in-browser WebGPU net, is an engineering demo and at n=21 does not beat the formula, so it is not shown here as a result.

4 CBAM sektörünün tümünde n=19 doğrulanabilir tesiste birini-dışarıda-bırak. Yayımlanan temel kapalı-form formüldür. Ridge regresyon onun gerisinde — fizik öncel olmadan, 18 özelliği bir avuç örneğe fazla uyum sağlıyor. iz, tarayıcı-içi WebGPU ağı, bir mühendislik demosudur ve n=21'de formülü geçmez; bu yüzden burada bir sonuç olarak gösterilmez.

Figure 1 — Per-plant predictions vs EU CBAM default

Şekil 1 — Tesis-bazlı tahminler ve AB CBAM varsayımı

Each pair of bars is one held-out facility. Light red = EU CBAM default. Green = leave-one-plant-out prediction (median). Black tick = audit-grade disclosed Scope 1 truth. log-y. Bars sorted by truth ascending. The shipped result is the closed-form formula (+82.3%, n=19); iz, the in-browser WebGPU net, is an engineering demo shown for illustration only and is not part of the result.
Her bir çubuk çifti tek bir dışarıda-bırakılmış tesisi gösterir. Açık kırmızı = AB CBAM varsayımı. Yeşil = birini-dışarıda-bırak tahmini (medyan). Siyah işaret = denetim-düzeyi beyan edilen Kapsam 1 gerçek değer. log-y. Çubuklar gerçek değere göre artan sırada. Yayımlanan sonuç kapalı-form formüldür (+%82.3, n=19); iz, tarayıcı-içi WebGPU ağı, yalnızca gösterim amaçlı bir mühendislik demosudur ve sonucun parçası değildir.

Table 1 — Leave-one-plant-out predictions

Tablo 1 — Birini-dışarıda-bırak tahminleri

The headline is the cf-corrected formula at +82.3% log-MAE reduction vs the EU CBAM default, leave-one-plant-out over the n=19 validatable plants. The last two rows — BAGFAŞ (sole N₂O-controlled fertilizer plant) and Gübretaş (sole blender) — are each the only plant of their route, cannot be validated leave-one-plant-out, and are excluded from the headline. The prediction column below is the formula's leave-one-plant-out estimate, not a learned model.
Ana sonuç, AB CBAM varsayımına karşı %82.3 log-MAE azaltan cf-düzeltilmiş formüldür; n=19 doğrulanabilir tesiste birini-dışarıda-bırak. Son iki satır — BAGFAŞ (tek N₂O-kontrollü gübre tesisi) ve Gübretaş (tek harmancı) — kendi rotasının tek tesisi olduğu için birini-dışarıda-bırak ile doğrulanamaz ve ana sonuçtan hariç tutulur. Aşağıdaki tahmin sütunu formülün birini-dışarıda-bırak tahminidir, öğrenilmiş bir model değil.
FacilityTesis Sector / routeSektör / rota Truth (tCO₂/yr)Gerçek (tCO₂/yıl) formula (LOPO)formül (LOPO) ratiooran EU defaultAB varsayımı Δ vs EUAB'ye karşı Δ
Afyon Çimentocementçimento1,200,000707,2180.59×2,851,200-75%
Akçansa Büyükçekmececement · allocatedçimento · tahsis edilmiş1,514,0001,791,3051.18×3,960,000-55%
Akçansa Çanakkalecement · allocatedçimento · tahsis edilmiş3,466,0003,865,9191.12×8,712,000-56%
Akçansa Ladikcement · allocatedçimento · tahsis edilmiş499,000593,8741.19×1,584,000-63%
Batısöke Sökecementçimento1,577,9261,414,6940.90×6,336,000-78%
Bursa Çimentocementçimento1,121,545707,3470.63×3,168,000-78%
Göltaş Ispartacementçimento1,669,0721,972,4081.18×7,920,000-75%
Nuh Herekecementçimento3,584,9532,466,7760.69×9,028,800-73%
Çolakoğlu Gebzesteel · EAF566,519539,5390.95×8,550,000-94%
Habaş Aliağasteel · EAF830,338842,5381.01×8,550,000-90%
İzdemir Aliağasteel · EAF271,123280,7351.04×2,850,000-90%
Erdemir Ereğlisteel · BF/BOF6,667,2327,288,9061.09×7,600,000-4%
İsdemir İskenderunsteel · BF/BOF10,663,36411,167,5351.05×10,070,000+11%
Kardemir Karabüksteel · BF/BOF5,650,6264,957,3360.88×6,650,000-25%
Assan Tuzlaaluminum · downstreamalüminyum · aşağı akış108,50092,4160.85×540,000-83%
ASAŞ Akyazıaluminum · downstreamalüminyum · aşağı akış68,61880,5601.17×375,000-79%
Toros Mersinfertilizer · integrated · allocatedgübre · entegre · tahsis edilmiş383,150280,2040.73×648,000-57%
Toros Samsunfertilizer · integrated · allocatedgübre · entegre · tahsis edilmiş255,180207,3150.81×460,000-55%
Toros Ceyhanfertilizer · integrated · allocatedgübre · entegre · tahsis edilmiş203,840376,6741.85×657,360-43%
BAGFAŞ Bandırma — single-plant, not validatable (excluded from headline)— tek tesis, doğrulanamaz (ana sonuçtan hariç)fertilizer · N₂O-controlledgübre · N₂O-kontrollü9,82817,4651.78×560,000-97%
Gübretaş Yarımca — single-plant, not validatable (excluded from headline)— tek tesis, doğrulanamaz (ana sonuçtan hariç)fertilizer · blendergübre · harmancı13,28115,1001.14×640,000-98%

Big-emitter predictions (Erdemir, İsdemir, Kardemir, Çolakoğlu, Akçansa Çanakkale, Batısöke) land within ±30% of audit. BAGFAŞ (1.78×) is the only N₂O-controlled facility in our disclosure set and Gübretaş the only blender, so under leave-one-plant-out neither has an in-route peer to derive an EF from — both fall back to sector defaults and are excluded from the headline (n=19). The cement under-predictions (Afyon 0.59×, Bursa 0.63×, Nuh 0.69×) run above the sector-default capacity factor, which the formula prior can't infer without disclosed cf.

Büyük emitör tahminleri (Erdemir, İsdemir, Kardemir, Çolakoğlu, Akçansa Çanakkale, Batısöke) denetimin ±%30 sınırında. BAGFAŞ (1.78×) açıklama setimizdeki tek N₂O-kontrollü tesis, Gübretaş ise tek harmancı; bu yüzden birini-dışarıda-bırak altında ikisinin de EF türetilecek aynı-rotada eşi yok — ikisi de sektör varsayımına geri dönüyor ve ana sonuçtan hariç tutuluyor (n=19). Çimento düşük-tahminleri (Afyon 0.59×, Bursa 0.63×, Nuh 0.69×) sektör-varsayımı kapasite faktörünün üstünde çalışıyor; formül beyanlı cf olmadan bunu bilemez.

External validity — Verifier B6 (372 EU cement installations)

Dış geçerlilik — Doğrulayıcı B6 (372 AB çimento tesisi)

The strongest evidence that the closed-form formula generalizes beyond the n=19 Turkish set is Verifier B6: the same capacity × route-EF × cf formula applied to 372 EU cement installations whose emissions are EUTL third-party-verified gives a median predicted/verified ratio ≈ 1.0, against the EU CBAM default's ≈ 2.5×. These are independent, third-party-verified labels — not operator self-reports — so B6 directly addresses the "audit-grade ≠ third-party-verified" caveat below.

Kapalı-form formülün n=19'luk Türkiye setinin ötesine genellendiğine dair en güçlü kanıt Doğrulayıcı B6'dır: aynı kapasite × rota-EF × cf formülü, emisyonları EUTL üçüncü-taraf-doğrulu olan 372 AB çimento tesisine uygulandığında tahmin/doğrulanmış medyan oranı ≈ 1.0 verir; AB CBAM varsayımının ≈ 2.5×'ine karşı. Bunlar bağımsız, üçüncü-taraf-doğrulu etiketlerdir — operatör beyanı değil — bu yüzden B6, aşağıdaki "denetim-düzeyi ≠ üçüncü-taraf-doğrulu" uyarısını doğrudan giderir.

Contributions

Katkılar

  1. TR-MRV-Bench — 59-facility public per-facility emissions benchmark with three-tier supervision (21 audit-grade strong labels across all four CBAM sectors, 7 Climate TRACE per-asset labels, capacity-factor-corrected default labels for the remainder). Stratified train/val/test split by (scope × route) with route refinements per sector: steel (BF/BOF, EAF, DRI-EAF), aluminum (primary, downstream), fertilizer (integrated, integrated-n2o-controlled, blender). Provenance per label: direct (14), allocated (6), composite (1).
  2. cf-corrected formula as a strong baselinecapacity × EF × cf with EF priority route-specific (steel/Al/fertilizer) > company-specific > sector-mean and cf priority CT per-asset > disclosed-production-ratio > sector-mean. On the n=19 leave-one-plant-out eval this formula reduces log-MAE by 82.3% vs the EU CBAM default — the actionable shipped baseline (in-sample, leaky fit = +85.7%). Leave-one-plant-out per-facility ratios: Erdemir Ereğli 1.09× truth, İsdemir 1.05×, Akçansa Çanakkale 1.12×, Batısöke 0.90×, Çolakoğlu 0.95×.
  3. EU-default headroom is sector-asymmetric — The EU default over-estimates by 2-5× for cement and 5-10× for EAF steel, but is within 5% of audited truth for big BF/BOF integrated mills (İsdemir 10.07M EU vs 10.66M actual). The improvement is concentrated in cement and EAF; BF/BOF integrated steel sees structural limits.
  4. Climate TRACE systematically under-reports TR integrated steel — Across our three BF/BOF mills (Erdemir, İsdemir, Kardemir) CT estimates run 20-30% below disclosed audited Scope 1. Using CT-derived capacity-factors worsens accuracy because CT cf is computed from these under-reported emissions, so the formula uses operator-disclosed cf and excludes CT (CT features are neutral-to-negative at n=19).
  5. iz is an in-browser demo, not a result — A 2-layer LoRA-shaped MLP (18 features, browser-native WebGPU) ships as an engineering demo. At n=21 it does not beat the closed-form formula, so it is not part of the headline; it is a candidate for v1 once the bench scales to the ~800 EUTL plant-labels. Ridge regression on the same features lags the formula at 81.4%. Future work should focus on data growth (more disclosures, satellite features) before parameter growth.
  1. TR-MRV-Bench — 59-tesislik kamuya açık, tesis-bazlı emisyon veri seti; üç-katmanlı denetim (4 CBAM sektörü genelinde 21 denetim-düzeyi güçlü etiket; 7 Climate TRACE tesis-bazlı etiket; geri kalan için cf-düzeltilmiş varsayım etiketleri). (sektör × rota) ile katmanlı eğitim/doğrulama/test bölünmesi; sektör başına rota inceltmeleri: çelik (YF/BOF, EAF, DRI-EAF), alüminyum (birincil, aşağı akış), gübre (entegre, entegre-N₂O-kontrollü, harmancı). Etiket kaynağı: doğrudan (14), tahsis edilmiş (6), bileşik (1).
  2. Güçlü temel olarak cf-düzeltilmiş formülkapasite × EF × cf; EF önceliği rota-bazlı (çelik/Al/gübre) > şirket-bazlı > sektör-ortalama; cf önceliği CT tesis-bazlı > beyan edilmiş üretim-oranı > sektör-ortalama. n=19 birini-dışarıda-bırak değerlendirmesinde bu formül AB CBAM varsayımına karşı log-MAE'yi %82.3 azaltıyor — yayımlanan eyleme dönük temel (örneklem-içi, kopyalı uyum = +%85.7). Birini-dışarıda-bırak tesis-bazlı oranlar: Erdemir Ereğli 1.09× gerçek, İsdemir 1.05×, Akçansa Çanakkale 1.12×, Batısöke 0.90×, Çolakoğlu 0.95×.
  3. AB-varsayım marjı sektöre göre asimetriktir — AB varsayımı çimentoyu 2-5×, EAF çeliğini 5-10× abartıyor, ama büyük YF/BOF entegre tesislerinin denetim gerçeğine %5 dahilinde (İsdemir AB 10.07M ↔ gerçek 10.66M). İyileştirme çimento ve EAF'ta yoğunlaşıyor; YF/BOF entegre çelikte yapısal sınırlar var.
  4. Climate TRACE TR entegre çeliğini sistematik olarak düşük raporluyor — Üç YF/BOF tesisimizde (Erdemir, İsdemir, Kardemir) CT tahminleri beyan edilen denetim-düzeyi Kapsam 1'in %20-30 altında. CT-türevi kullanım-faktörleri doğruluğu kötüleştiriyor çünkü CT cf bu eksik raporlanmış emisyonlardan hesaplanıyor; bu yüzden formül operatör-beyanlı cf kullanır ve CT'yi dışlar (n=19'da CT özellikleri nötr-negatif).
  5. iz bir tarayıcı-içi demodur, sonuç değildir — 2-katmanlı LoRA-biçimli MLP (18 özellik, tarayıcı-yerli WebGPU) bir mühendislik demosu olarak yayımlanıyor. n=21'de kapalı-form formülü geçmiyor, bu yüzden ana sonucun parçası değil; veri seti ~800 EUTL tesis-etiketine ölçeklendiğinde v1 için bir aday. Ridge regresyon aynı özelliklerde formülün gerisinde, %81.4. Gelecek çalışma parametre büyütme yerine veri büyütmeye odaklanmalı (daha fazla beyan, uydu özellikleri).

What works (cf-corrected formula B1)

Ne işe yarıyor (cf-düzeltilmiş formül B1)

What doesn't (yet)

Ne henüz çalışmıyor

Section 6 — Ablations

Bölüm 6 — Ablasyonlar

9-variant feature ablation matrix on the leave-one-plant-out eval (n=19). What each design choice contributes to the full-feature model's reduction of +82.4% (in line with the shipped closed-form formula's +82.3%). This is a feature-contribution study, not an iz-beats-the-formula claim:

Birini-dışarıda-bırak değerlendirmesinde (n=19) 9-varyantlı özellik ablasyon matrisi. Her tasarım seçiminin tam-özellikli modelin +%82.4 azaltımına katkısı (yayımlanan kapalı-form formülün +%82.3'üyle uyumlu). Bu bir özellik-katkı çalışmasıdır, iz'in formülü geçtiği iddiası değil:

VariantVaryant log-MAE ReductionAzalma Δ vs fullTam'a karşı Δ EffectEtki
full (route + disc + ct + prior + sat)tam (rota + beyan + ct + öncel + uydu)0.251+82.4%full modeltam model
no_prior0.706+50.7%−31.7 ppphysics prior is the #1 contributorfizik öncel #1 katkıcı
no_route0.512+64.2%−18.2 pproute-aware EFs (steel/Al/fertilizer)rota-duyarlı EF'ler (çelik/Al/gübre)
no_disc0.405+71.7%−10.7 ppoperator-disclosed cfoperatör-beyanlı cf
no_ct0.252+82.4%~ 0CT features are neutral at n=19n=19'da CT özellikleri nötr
no_beirle0.241+83.2%+0.8 ppBeirle NOx slightly hurtsBeirle NOx hafifçe zarar veriyor
no_s5p0.229+84.0%+1.6 ppS5P NO₂ slightly hurtsS5P NO₂ hafifçe zarar veriyor
no_sat (both satellite off)no_sat (iki uydu da kapalı)0.259+81.9%−0.5 pp(within seed noise; satellites do not help)(tohum gürültüsü içinde; uydular yardım etmiyor)
no_disc + no_route0.561+60.9%−21.5 ppminimum-feature lower boundminimum-özellik alt sınır

N_OUTER=1 — small effects (≤2pp) are within seed noise; for stable CIs we'd need N_OUTER≥5. The clear conclusions: prior, route, disclosed-cf are the real signal carriers; CT and satellite features are net zero (or slightly negative) at this data scale. Same pattern as the CT-features-hurt finding from earlier — at n=19 with 15+ features, noisy auxiliary signals (CT cf computed from biased emissions; S5P NO₂ over individual plants) add variance without information.

N_OUTER=1 — küçük etkiler (≤2 puan) tohum gürültüsü içinde; kararlı CI'ler için N_OUTER≥5 gerekir. Açık sonuçlar: öncel, rota, beyanlı-cf gerçek sinyal taşıyıcıları; CT ve uydu özellikleri bu veri ölçeğinde net sıfır (veya hafif negatif). Önceki "CT özellikleri zarar veriyor" bulgusuyla aynı kalıp — n=19'da 15+ özellikle, gürültülü yardımcı sinyaller (yanlı emisyonlardan hesaplanan CT cf; tek tesis üzerindeki S5P NO₂) bilgi katmadan varyans ekliyor.

The full feature-ablation harness (the neural-net variant that produced these deltas) lives in the iz-lab repo; the table above is the honest summary.

Tam özellik-ablasyon aracı (bu farkları üreten sinir-ağı varyantı) iz-lab deposunda; yukarıdaki tablo dürüst özettir.

Path to v1

v1'e giden yol

  1. Sentinel-5P NO₂ bbox features for all 59 facilities (pipeline running; full pull blocked by Planetary Computer rate limits).
  2. Sentinel-2 RGB+NIR for plant footprint detection (yard activity ≈ production proxy).
  3. Landsat / Sentinel-3 SLSTR thermal over kiln/furnace centroid.
  4. Disclosed-cf feature for all facilities without CT match (back-computed from production tonnes in IAR).
  5. Federated .flora adapter format — one operator runs LoRA fine-tuning on its own CEMS data, ships only the rank-16 adapter.
  6. Ternary QAT (BitNet b1.58 style) on the multi-modal backbone, knowledge-distilled from the v1 fp16 teacher.
  1. Tüm 59 tesis için Sentinel-5P NO₂ bbox özellikleri (boru hattı çalışıyor; tam çekim Planetary Computer kotalarıyla bloklu).
  2. Sentinel-2 RGB+NIR ile tesis ayak izi tespiti (saha aktivitesi ≈ üretim vekili).
  3. Landsat / Sentinel-3 SLSTR ile fırın/yatak merkezi termal görüntüleme.
  4. CT eşleşmesi olmayan tüm tesisler için beyanlı-cf özelliği (Entegre Yıllık Faaliyet Raporu'ndaki üretim tonlarından geriye-hesap).
  5. Federe .flora adaptör formatı — bir operatör kendi CEMS verisi üzerinde LoRA ince-ayar yapıyor, sadece rank-16 adaptörü gönderiyor.
  6. Çok-modlu omurgada ternary QAT (BitNet b1.58 tarzı), v1 fp16 öğretmenden bilgi-damıtmalı.