2 2

Yige Li

Liyige

https://github.com/bboylyg

bboylyg

AI & ML interests

Trustworthy Machine Learning

Recent Activity

upvoted a paper about 2 months ago

AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents

upvoted a paper 2 months ago

Internal Safety Collapse in Frontier Large Language Models

new activity over 1 year ago

BackdoorLLM/Backdoored_Dataset:[bot] Conversion to Parquet

View all activity

Organizations

upvoted a paper about 2 months ago

AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents

Paper • 2604.02947 • Published Apr 3 • 19

upvoted a paper 2 months ago

Internal Safety Collapse in Frontier Large Language Models

Paper • 2603.23509 • Published Mar 4 • 31

New activity in BackdoorLLM/Backdoored_Dataset over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

Librarian Bot: Add language metadata for dataset

#2 opened over 1 year ago by

librarian-bot

authored a paper over 1 year ago

BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks on Large Language Models

Paper • 2408.12798 • Published Aug 23, 2024

updated 5 models over 1 year ago

published 5 models over 1 year ago

BackdoorLLM/Jailbreak_Llama2-70B_CTBA

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_MTBA

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_Sleeper

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_VPI

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_BadNets

Updated Feb 21, 2025

updated a dataset over 1 year ago

BackdoorLLM/Backdoored_Dataset

Viewer • Updated Feb 27, 2025 • 4.2k • 87

published a dataset over 1 year ago

BackdoorLLM/Backdoored_Dataset

Viewer • Updated Feb 27, 2025 • 4.2k • 87

updated 3 models over 1 year ago

BackdoorLLM/Refusal_Llama2-13B_BadNets

Updated Feb 21, 2025

BackdoorLLM/Refusal_Llama2-13B_Sleeper

Updated Feb 21, 2025

BackdoorLLM/Refusal_Llama2-13B_VPI

Updated Feb 21, 2025

Yige Li

AI & ML interests

Recent Activity

Organizations

Liyige's activity

[bot] Conversion to Parquet

Librarian Bot: Add language metadata for dataset