2 12 3

Ming Zhang

konglongge

konglonggeFDU

AI & ML interests

LLMs

Recent Activity

liked a dataset 9 days ago

llmeval-fdu/LLMEval-Logic

upvoted a paper 10 days ago

LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening

submitted a paper 10 days ago

LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening

View all activity

Organizations

liked a dataset 9 days ago

llmeval-fdu/LLMEval-Logic

Viewer • Updated 10 days ago • 351 • 463 • 5

upvoted a paper 10 days ago

LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening

Paper • 2605.19597 • Published 12 days ago • 20

submitted a paper to Daily Papers 10 days ago

LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening

Paper • 2605.19597 • Published 12 days ago • 20

updated a dataset 10 days ago

llmeval-fdu/LLMEval-Logic

Viewer • Updated 10 days ago • 351 • 463 • 5

updated a dataset 19 days ago

konglongge/TaxoBench

Updated 19 days ago • 59

published a dataset 19 days ago

konglongge/TaxoBench

Updated 19 days ago • 59

updated 2 datasets 19 days ago

konglongge/TransferTOD

Preview • Updated 19 days ago • 1.02k

konglongge/PFDial

Preview • Updated 19 days ago • 71

published a dataset 19 days ago

llmeval-fdu/LLMEval-Logic

Viewer • Updated 10 days ago • 351 • 463 • 5

published a dataset 21 days ago

konglongge/PFDial

Preview • Updated 19 days ago • 71

updated a dataset 21 days ago

llmeval-fdu/LLMEval-Med

Updated 21 days ago • 67

published 2 datasets 21 days ago

llmeval-fdu/LLMEval-Med

Updated 21 days ago • 67

konglongge/TransferTOD

Preview • Updated 19 days ago • 1.02k

updated a dataset 22 days ago

llmeval-fdu/LLMEval-Fair

Viewer • Updated 22 days ago • 229k • 458

published a dataset 22 days ago

llmeval-fdu/LLMEval-Fair

Viewer • Updated 22 days ago • 229k • 458

updated a dataset 22 days ago

llmeval-fdu/LLMEval-1

Viewer • Updated 22 days ago • 5.43k • 82

published a dataset 22 days ago

llmeval-fdu/LLMEval-1

Viewer • Updated 22 days ago • 5.43k • 82

updated a dataset 22 days ago

llmeval-fdu/LLMEval-2

Viewer • Updated 22 days ago • 9.6k • 86

published a dataset 22 days ago

llmeval-fdu/LLMEval-2

Viewer • Updated 22 days ago • 9.6k • 86

upvoted a paper about 1 month ago

OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language World Models

Paper • 2604.10866 • Published Apr 13 • 66

Ming Zhang

AI & ML interests

Recent Activity

Organizations

konglongge's activity