Journal Club: Parçacık Fiziğinde ‘Derin Öğrenme’

Yapay Öğrenme (‘Machine Learning’) ve Derin Öğrenme (Deep Learning) gibi günümüzün en çok konuşulan veri analiz yöntemleri elbette parçacık fiziğinde de kendisine fazlasıyla yer buluyor. 1980’lerden itibaren özellikle ‘Boosted Decision Trees’ ve ‘Artificial Neural Network’ gibi yöntemlere birçok analizde yer veren öncü bir komünite için bu çok da şaşılacak bir durum değil aslında. Biz de bu hafta Journal Club’da geçtiğimiz haftalarda parçacık fiziğinde bu yöntemlerinn kullanımında önücülük yapan üç yazarın kaleme aldıkları bir makaleyi okumaya karar verdik:

Deep Learning and its Application to LHC Physics

Konuyu uzaktan takip edenler için ‘Derin Öğrenme’ ve çeşitli ‘Yapay Öğrenme’ yöntemleri arasındaki bağı açıklayarak başlayalım. Yapay Öğrenme sistemleri elinizdeki problemi veriden yola çıkarak, bir takım istatistiksel özellikleri elle kodlamadan sistemin ‘kendisinin öğrenmesi/keşfetmesi’ sayesinde çözüm getiren yöntemler bütünü olarak tanımlanabilir. Yapay Sinir Ağları, ‘Support Vector Machines’, ‘Logistic Regression’, ‘Clustering’ gibi birçok farklı yöntemleri içinde barındıran bu metodlar ailesininin bir üyesi olan ‘Yapay Sinir Ağları’ son dönemlerdeki bir takım algoritma iyileştirmeleri, GPU gibi grafik işlemcilerin bu alanda kullanımı ve birçok hazır yazılım kütüphanesinin kullanıma açılmasıyla büyük bir ivme kazandı. Bu gelişmeler sayesinde obje tanımlama, ses tanıma gibi birçok ‘örüntü tanıma’ probleminde eski yöntemlere açık ara fark atan bu yöntemler en temel hesaplama yapıları olan ve biyolojik sistemlerden ilham alınarak ‘nöron’ olarak adlandırılan yapılarının birbirine çok katmanlı, ‘derin’ bir ağ şeklinde (aşağıdaki görsel – Figure 1) bağlanmaları nedeniyle ‘Derin Öğrenme’ yöntemleri olarak anılır oldular.

Bu yöntemlerin karakteristik özellikleri, yapılarındaki katmanların hiyerarşik bir şekilde elinizdeki verinin içindeki özellikleri ‘şablonlar’ şeklinde kodluyor ve sonrasında hiç görmediği bir örnekle karşılaştığında bunlardan yola çıkarak üst seviyede bir performansla genelleştirebiliyor olması. Örneğin sisteme içerisindeki özellikleri öğrenip, sınıflandırma yapabilmesi için görsellerin piksel değerlerini girdi olarak verdiğinizde, ilk katmanda en basit yapılar olan ‘çizgi, köşe, kenar’ gibi yapıları, sonrasında temel geometrik şekilleri (kare, yuvarlak vb…), daha sonrasında ise daha üst gösterimler olan, eğer canlı görselleriyle, göz, kaş, burun gibi özellikleri kodluyor. Tüm bunları elinizdeki veriden ve bunlarla ilişkili olan ‘etiketlerden’ yola çıkarak, ağırlık (weight) dediğimiz milyonlarca sayıyı bir şekilde ‘öğrenerek’ yapıyor.

Derin öğrenmenin deneysel parçacık fiziği için ilgisi ise CERN’de LHC deneylerinde alınan verinin, tıpkı yukarıda bahsettiğimiz görüntü verileri ile benzer yapıda olması. En alt seviyede dedektör sinyallerinden, sonrasında adım adım oluşturulmuş parçacığın dedektörde izlediği ‘yol’ (track), kalorimetrede enerjisini bıraktığı hücreler bütünü (calorimetry cell clusters), ardından bu bilgilerden yola çıkarak oluşturulan elektron, muon, foton ya da içinde birçok hadron barındıran jet objeleri şeklinde elimizdeki veri tam anlamıyla ‘hiyerarşik’ bir yapı sergiliyor. Önerilen yöntemler, LHC verilerini bu tip algoritmalara verdiğimizde, verinin içindeki detaylardan yola çıkarak hedeflenen görevi yerine getirecek, elle kodlamaya gerek kalmadan bunu sadece veriyi kullanarak kendi öğrenebilecek bir sistem geliştirmek yönünde. Burada bahsi geçen hedefler örneğin iç dedektörde yüzlerce parçacığın izini birbirinden ayırmaktan, kalorimetrede bıraktığı enerji kalıntılarından parçacığı tanımlamaya (aşağıdaki görsel – Figure 3) ve aradığımız sinyali gürültüden ayırmaya kadar birçok zorlu problemi içeriyor.

Makalede bu problemleri ayrı ayrı başlıklar altında detaylıca ele alıp, her biri konusunda mevcut çalışmalara ve geliştirilen yöntemlere yer veriliyor. Yazarlar yöntemleri mevcut kullanılan yöntemlerle etkili bir şekilde karşılaştırıp derin öğrenme yöntemlerinin artı ve eksilerini beraber tartışıyorlar. Makalenin sonunda da bu alanın nereye doğru ilerlediğine dair güzel bir değerlendirme bölümü ile yazıyı sonlandırıyorlar.

Yapay Öğrenme ve Derin Öğrenme konuları son yıllarda CERN’le ilişkili birçok deneyde gerek dedektör seviyesinde gerekse de fizik analizlerinde kullanılmak üzere fazlasıyla dile getirilen, konuyla ilgili çalışma gruplarının kurulup her hafta düzenli seminer ve toplantıların yapıldığı bir noktaya doğru evrilmiş durumda. LHC yeni veriler almaya devam ettikçe ve çalışma performansı arttıkça bahsi geçen problemleri çözmek standart yöntemlerle gittikçe zorlaşırkan, önerilen derin öğrenme yöntemleri birçok kişiye göre fazlasıyla umut vaat ediyorlar. Makale bu alanı ve yöntemleri deneysel parçacık fiziği açısından keşfetmek için tam anlamıyla bir başucu kaynağı niteliği taşıyor.

* Bu yazı, aynı zamanda lab üyesi A. Bayırlı’nın blogu Standart Model‘de de yayınlanmıştır.

Journal Club: ATLAS’ın Higgs->b kuark + anti-b kuark Keşfi

Standart Model’de temel parçacıklar ‘spin’ olarak adlandırdığımız parçacığın iç-kuantum durumundan kaynaklı özelliğine göre iki farklı aileye ayrılıyorlar: Yarım kesirli değerler (1/2, 3/2 vb.) alan ‘fermiyonlar’ ve tam sayı değerler alabilen (0,1,2 vb.) ‘bozonlar’. Fermiyonlar evrendeki maddenin hemen hemen tümünü oluştururken bozonlar da bu parçacıklar arasındaki etkileşimlerin aktarımında, ‘kuvvet taşıyıcı parçacıklar’ olarak işlev görüyorlar. Bu resme en son eklenen Higgs bozonu ise tüm parçacıklarla etkileşerek onların kütle kazanmalarını sağlıyor. Bunu kabaca şöyle yapıyor: Standart Model’de örneğin yüklü parçacıkların birbiriyle etkileşimini ya da proton içindeki kuarkların güçlü etkileşimlerini kendisinden hareket denklemlerini çıkardığımız ‘Lagrangian’ adı verilen bir ifadede yazıyoruz.

Üstte: Standart Model ‘Lagrangian’ ifadesinin bir kahve bardağına sığan hali. Denklemin üçüncü ve dördüncü satırları Higgs alanı ve bu alanın diğer parçacıklarla etkileşimini tanımlıyor.

Bu ifadeye belirli simetrileri (yerel Gauge simetrileri) koruyacak terimler ekleyebiliyoruz, çünkü bu durumda, bu ifadeden elde edeceğimiz hareket denklemleri değişmez (invariant) kalıyor. Higgs parçacığı olmadan bu ifadeye yazacağımız ve parçacıkların kütleye sahip olmasını sağlayacak terimler bahsi geçen simetri koşullarını sağlamıyorlar. Fakat deneysel olarak biliyoruz ki elektro-zayıf etkileşimi taşıyan W-Z bozonları ve aynı zamanda tüm fermiyonlar kütleye sahipler ve bu özelliği Lagrangian’da matematiksel bir şekilde ifade etmemiz gerekiyor. Bunun için 1960’larda ortaya atılan Higgs (Braut-Englert) mekanizması bu sorunu çözmek için yeni bir kuantum alanı tanımlayıp, bu kuantum alanının en düşük enerjili ‘vakum durumunun’, alanın kendi simetrisini sağlamaması fikri ortaya atılıyor. Simetrideki bu bozulma (‘Elektro-zayıf simetri kırılması‘ olarak adlandırılan), Higgs alanın en temel durumunda sıfır olan ‘vakum beklenen değerini’ sıfırdan farklılaştırarak, Higgs ile etkileşecek parçacıklar için artık birer kütle terimi yazabilme olanağı yaratıyor. Bu durum yalnızca bosonlar için değil, çok benzer bir yaklaşımla fermiyonlar için de aranan kütle terimlerini yazılabilir hale geliyor. Bu terimlerin yazılabilmesi parçacıklara kütle özelliği vermenin yanında Higgs alanı ile etkileşmelerini de sağlıyor. Bu etkileşimin gücünü belirleyen ‘çiftlenim sabiti’ (coupling constant) ise doğrudan parçacığın kütlesiyle doğru orantılı bir büyüklük oluyor. Dolayısıyla, Higgs alanının gerçekten de parçacıklara kütle verdiğini test etmenin en güzel yolu da parçacıkların Higgs ile etkileşmelerini test etmekten geçiyor. Bu testler LHC’de oluşan Higgs parçacıkların beraber oluştukları parçacıkları veya Higgs’in bozunduğu parçacıkları inceleyerek mümkün olabiliyor. 

Solda: Standart Model’de parçacıkların Higgs bozonu ile etkileşim gücü (y-ekseni) parçacığın kütlesiyle (x-ekseni) doğru orantılı olduğunu tahmin ediyor (kesikli mavi çizgi). Dikey hata çizgileri ile birlikte verilen veriler (siyah noktalar) Standart Model tahmini ile epey uyumlu görünüyorlar (ATLAS Collaboration/ATLAS-CONF-2018-031).

Higgs bozonu ile parçacıkların etkileşimi kütleleriyle orantılı olduğundan, Higgs ile en çok, fermiyon ailesinden ağır kuarkların, örneğin ‘top’ ve ‘bottom’ kuarkların etkileşmesini bekliyoruz. Top kuarkı, ilginç bir şekilde çok ağır (Higgs’den de ağır) olduğundan enerji korunumu nedeniyle Higgs’in bozunması ile oluşturmak mümkün olmuyor. Onun yerine proton çarpışmalarında Higgs bozonu ile beraber oluşan top kuarklar incelenebiliyor ki bu yaz ATLAS ve CMS bu etkileşimi gözlediklerini ve gözlemlerin Standart Modelle tam olarak uyumlu olduğunu duyurmuştu.

Top’ın ardından kütle olarak sıradaki bottom kuark ise Higgs’in bozunabildiği kanallardan birini oluşturuyor; hatta tüm bozunumların %58’i bu kanalda gerçekleşiyor. (Higgs parçacığı yüksüz olduğundan oluşan bir bottom kuarkla birlikte anti-parçacığı olan bir de anti-bottom kuark(anti-b) oluşuyor.) Bu hafta Journal Club’da okuduğumuz makale de Ağustos ayında ATLAS deneyinin Higgs’in bir b bir de anti-b kuarka bozunduklarını gözlediğini duyurdukları makale:

Akla hemen şu soru gelebilir: Higgs madem en çok b ve anti-b kuarka bozunuyor, neden o halde en Higgs’in 2012’de keşfi bu kanalda yapılmadı da Higgs’in iki fotona (di-gamma) ve Z bozonları aracılığı ile 4 lepton’a bozunduğu kanalda gözlendi? Bunun cevabı, LHC’nin bir proton-proton çarpıştırıcısı olması sebebiyle proton çarpışmalarında proton içerisindeki kuark ve gluonların ‘güçlü etkileşimi’ sonucu oluşan yeni parçacıklarının çoğunun da quarklarla ilişkili olmasında yatıyor. Dolayısıyla Higgs’in bozunmasından gelen kuarkları bu kalabalığın içinde görebilmemiz epey güç.

Aradığımız sinyal ile benzer özelliklere sahip fakat başka proseslerden gelen sinyallere ‘arkaplan’ (background) diyoruz. Analiz sırasında, aranan sinyali bulabilmek için arkaplanı bir şekilde iyi tanımlayıp elimine etmenin yolunu bulmak gerekiyor. Bir diğer konu; Higgs’in b-quarklara bozunumunu doğrudan gözlemek yerine, çarpışmalar sonucu oluşan ve dedektör içinde tespit edilmeleri daha kolay olan elektron, muon gibi leptonlara bozunan bir vektör bozonu (Z ya da W) ile birlikte oluşan Higgs parçacıklarına odaklanmak, her ne kadar elimizdeki olay sayısını azaltsa da en azından sinyali bulmak konusunda işimizi kolaylaştırıyor. Bu çalışmada da tam olarak bu şekilde pp->VH prosesleri inceleniyor (V: vektör bozon, H: Higgs).

Üstte: Solda, çarpışan protonların içindeki iki kuarkın bir vektör bozunumu ile etkileşip, bu vektör bozonunun bir Higgs bozonu yayımlaması ve ardından Higgs’in b ve anti-b kuarklarına bozunumunu gösteren Feynman diyagramı. Diyagramı zamanın soldan sağa doğru ilerlediğini düşünerek okuyabilirsiniz. Bu tip diyagramlar etkileşim süreçlerini görselleştirmenin ötesinde Feynman’a borçlu olduğumuz dahiyane hesaplama yöntemlerine de izin veriyor. (Kaynak: Nature)

Bu makalede de Higgs’in bir vektör bozon ile birlikte oluşup, sonrasında Higgs’in b-anti-b qurklara, vektör bozonun da leptonlara bozunması gözlenerek alınan verilerin Standart Model ile uyumlu olup olmadığı test edilmeye çalışılıyor.

Üstte: ATLAS dedektöründe proton proton (pp) çarpışmaları sonucunda ortaya çıkan Higgs(H)’in b ve anti-b quarklarına bozunumu sonucu ortaya çıkan iki jet (açık mavi koniler – sağda) ve Higs’in yanında ortaya çıkan W bozonunun bozunması ile ortaya çıkan muon’un bıraktığı izler (kırmızı) görülüyor. Muon ile birlikte oluşan muon nötrinosu dedektörle etkileşmeden geçip gittiği için görüntüde onun izi görülmüyor. Sol taraftaki görüntü, dedektörü üç boyutlu olarak gösterirken, sağ alttaki ise parçacıkların çarpıştıkları eksene dik düzlemi gösteriyor. Her iki görüntüde de açık yeşil renkler parçacıkların elektromanyetik kuvvet ile etkileşip enerjilerini bıraktıkları elektromanyetik kalorimetre sinyallerini; sarı ile göterilenler de güçlü kuvvet ile etkileşip enerjilerini bıraktıkları ‘hadronik kalorimetre’ sinyallerini gösteriyor. Parçacıkların dedektörde bıraktıkları bu izlerden parçacıklar tanımlanıp, momentum ve enerji ölçümleri gerçekleştiriliyor.

Analiz iki farklı yöntemle gerçekleştiriliyor. Birinde Higgs sinyalini arkaplan sinyalinden ayırt edebilmek için Boosted Decision Trees (BDT) yöntemleri kullanıyor. Bu yöntemler, elinizdeki verinin belirli özelliklerini kullanıp (örneğin bir olaydaki parçacıkların momentum değerleri, enerjileri vs…) olayları sınıflandırabilmenizı sağlayan birer ‘machine learning’ yöntemleri. İkinci yöntemde ortaya çıkan b-quarkların oluşturdukları jet yapılarını bir araya getirerek ‘invariant mass’ değeri elde ediliyor. Elimizdeki jetler eğer Higgs bozunumu sonucunda oluşmuş quarklardan geliyorsa gözlenen olay sayısında Higgs kütlesi civarında bir ‘artış’ görülmesi bekleniyor.

Sonuç olarak BDT ve ‘invariant mass’ yöntemlerinin her ikisiyle de elde edilen sonuçlar, Higgs’in b ve anti-b kuarklarına bozunduklarını; üstelik bozunma oranının yani bu şekilde beklenen olay sayısının Standart Model’in tahmin ettiği değerlerle belirli bir hata payı içinde tutarlı olduğunu gösteriyor.

Üstte: Her iki grafikte de b ve anti-b quarkın ‘invarint’ kütlesi, o kütle değerinde gözlenen olay sayısıyla çizilmiş. Grafikte farklı renklerle verilmiş içi dolu kutular arkaplanı ve sinyali modelleyen (Standart Model’i kullanarak üretilen) Monte Carlo simülasyonlarını, siyah noktalarla gösterilenler de verileri ifade ediyor. Kırmızı renkler sinyali aradığımız VH olaylarının sinyalini gösteriyor. Grafiklerde görüldüğü gibi veri aradığımız VH olaylarından gelen katkıyla (kırmızı kutu) birlikte Monte Carlo ile uyumlu. Bu da aradığımız sinyalin varlığını ve Standart Modelle uyumlu olduğunu gösteriyor.

Bu hassas ölçüm Higgs mekanizmasının leptonların kütlesinden de sorumlu oldukları teorisini doğruluyor. Higgs’in LHC’de keşfinin üzerinden altı sene geçmesine rağmen parçacığa dair yepyeni şeyler test edip, öğrenmeye devam ediyoruz. Şu ana kadar yapılan gözlemler elimizdeki Standart Model ile uyumlu görünüyor.  Fakat yapılan her bir ölçüm, ölçüm süreçleri ve alınan verinin büyüklüğü ile birlikte ancak bir hata oranı ile bir sonuç veriyor. Ölçümler üzerindeki hata payları hala Standart Model’den sapmalara yönelik açık kapı bırakmaya devam ediyor. Bu sapmalar birçok fizikçiyi heyecanlandıracak ‘Standart Model’in ötesinde bir Fizik’e işaret edebilecek fakat bunu bilmenin tek yolu bu tip hassas ölçümleri yılmadan yapmaya devam etmekten geçiyor.

  • Makaleyi okumak için: arXiV
  • Makale ile ilişkili ATLAS’ın basın duyurusu için tıklayınız.
  • ATLAS’ın araştırmaya dair yazdığı özet şeklinde Fizik Brifing’i için tıklayınız.
  • Makalelerin Phys. Rev.’de yayınlanması ile birlikte yayınlanan kısa bir yazı için: Physics
  • Nature’da yayınlanan güzel bir yazı için: Nature

* Bu yazı, aynı zamanda lab üyesi A. Bayırlı’nın blogu Standart Model‘de de yayınlanmıştır.

Journal Club: CMS’in 28GeV’de gözlediği sinyal!

Bu haftanın makalesi son haftalarda birçok haber sitesinde de başlık olan LHC’deki diğer büyük deney CMS‘in duyurduğu ‘yeni bir parçacığa dair olabilecek bir sinyal’ makalesi:

Search for resonances in the mass spectrum of muon pairs produced in association with b quark jets in proton-proton collisions at s√=8 and 13TeV

Makaleleri tüm detaylarıyla incelemektense makalenin özeti üzerinden önemli noktaları belirleyip, makale içinden grafik yada hesaplamalara referans ederek ilerleyelim.

İlk cümleden başlayalım:

Çalışma 12-70 GeV kütle aralığında (parçacık fiziğinde kütleler enerji biriminde veriliyor – 1 GeV: 1 milyar elektron-volt), nispeten “düşük kütleli” bir rezonans parçacığı araması üzerine. Belirli bir kütlede, stabil olmayıp kısa bir sürede başka parçacıklara bozunan parçacıklara ‘rezonans’ adı veriliyor ve makalede ilgilenilen olaylar, çeşitli modellerin öngördüğü, Higgs parçacığının kütlesinden (125 GeV) daha küçük ve oluşurken yanında iki tane ‘jet’ adını verdiğimiz kuarklarla ilişkili yapıların ortaya çıktığı durumlar. Bu olaylardaki rezonansın kendini doğrudan gözlemek mümkün değil. Bunun yerine, bu parçacığın bozunması sonucu oluşan ve elektron’un özelliklerine birçok anlamda benzeyen, yalnız kütlesi elektrondan 200 kat fazla ‘muon’ ve antiparçacığı ‘anti-muon’ çiftinin bir araya getirilmesi ile rezonansa dair ölçüm yapılabiliyor.

Çalışma LHC’deki CMS dedektörü ile kütle merkezi enerjisi 8 TeV (1 Tev = 10^12 eV) ve 13 TeV‘de alınan iki veri seti üzerinde ayrı ayrı yapılmış. 19.7 ve 35.9 fb^-1 değerleri ise LHC’de kaydedilen toplam çarpıştırma miktarını ifade etmek için kullanılan 1/fb (inverse femtobarn) cinsinden ifadesi. CMS dedektörü, protonların zıt yönlerde ışık hızının %99.9999’uyla hareket ettiği tünelde parçacıkların mıknatıslar yardımıyla bir aray getirilip çarpıştırıldığı bölgelerden birinde yer alıyor. Çarpışma sonucu ortaya çıkan parçacıkların momentumları, enerjileri ve daha birçok özelliğini ölçmek için yapısında birçok alt dedektöre sahip. Farklı parçacıkların dedektörün farklı komponentleri ile etkileşerek bıraktıkları izler aşağıdaki görselde görülüyor.

Üstte: Yüklü parçacıkların (muon, elektron ve yüklü hadronlar) dedektör içindeki manyetik alan nedeniyle izledikleri yolun eğriliğinden hız ölçümleri, elektromanyetik etkileşen yüklü parçacıkların elektromanyetik kalorimetrelerde enerji ölçümleri, güçlü etkileşen hadronların hadron kalorimetrelerinde enerji ölçümleri ve son olarak muonların dedektörün en dış kısmındaki muon odalarında hız ve enerji ölçümleri gerçekleştiriliyor.