metadata
language: tr
tags:
- text-classification
- transformers
- roberta
- lora
datasets:
- savasy/ttc4900
metrics:
- accuracy
- f1
model-index:
- name: xlm-roberta-ttc4900-merged
results:
- task:
name: Text Classification
type: text-classification
dataset:
name: TTC-4900
type: savasy/ttc4900
metrics:
- name: Accuracy
type: accuracy
value: 0.894
- name: Macro-F1
type: f1
value: 0.89
📌 XLM-RoBERTa + LoRA ile Türkçe Konu Sınıflandırma (TTC-4900)
Bu model, xlm-roberta-base tabanlı olup LoRA (Low-Rank Adaptation) ile TTC-4900 haber veri seti üzerinde ince ayar yapılmıştır.
Amaç: Türkçe haberleri 7 farklı konu başlığına otomatik sınıflandırmak.
📊 Performans
- Accuracy: %89.4
- Macro-F1: 0.89
| Sınıf | Precision | Recall | F1 |
|---|---|---|---|
| ekonomi | 0.90 | 0.74 | 0.81 |
| siyaset | 0.77 | 0.85 | 0.81 |
| dünya | 0.90 | 0.80 | 0.85 |
| kültür | 0.92 | 0.99 | 0.95 |
| sağlık | 0.96 | 0.99 | 0.97 |
| spor | 0.97 | 0.97 | 0.97 |
| teknoloji | 0.85 | 0.90 | 0.87 |
🚀 Kullanım
from transformers import pipeline
pipe = pipeline(
"text-classification",
model="celalkartoglu/xlm-roberta-ttc4900-merged",
tokenizer="celalkartoglu/xlm-roberta-ttc4900-merged",
return_all_scores=True
)
text = "Merkez Bankası faiz oranlarını sabit tuttu."
print(pipe(text))