Milo Banks's picture

24

Milo Banks

milobanks

AI & ML interests

None yet

Recent Activity

upvoted a paper about 14 hours ago

PAIWorld: A 3D-Consistent World Foundation Model for Robotic Manipulation

upvoted a paper about 14 hours ago

Physics-IQ Verified

upvoted a paper about 14 hours ago

MaineCoon: Pursuing A Real-Time Audio-Visual Social World Model

View all activity

Organizations

None yet

upvoted 4 papers about 14 hours ago

PAIWorld: A 3D-Consistent World Foundation Model for Robotic Manipulation

Paper • 2606.18375 • Published 7 days ago • 11

Physics-IQ Verified

Paper • 2606.18943 • Published 6 days ago • 5

MaineCoon: Pursuing A Real-Time Audio-Visual Social World Model

Paper • 2606.17800 • Published 7 days ago • 13

Kairos: A Native World Model Stack for Physical AI

Paper • 2606.16533 • Published 7 days ago • 36

upvoted 6 papers 1 day ago

BadWorld: Adversarial Attacks on World Models

Paper • 2606.16519 • Published 8 days ago • 18

OmniDirector: General Multi-Shot Camera Cloning without Cross-Paired Data

Paper • 2606.13432 • Published 12 days ago • 106

Avatar V: Scaling Video-Reference Avatar Video Generation

Paper • 2606.13872 • Published 12 days ago • 9

Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation

Paper • 2606.17030 • Published 8 days ago • 28

PermaVid: Consistent Video Generation Across Edits via Disentangled Context Memory

Paper • 2606.16449 • Published 8 days ago • 5

Beyond Monolingual Deep Research: Evaluating Agents and Retrievers with Cross-Lingual BrowseComp-Plus

Paper • 2606.15345 • Published 10 days ago • 16

upvoted 8 papers 3 days ago

ActWorld: From Explorable to Interactive World Model via Action-Aware Memory

Paper • 2606.17730 • Published 7 days ago • 8

iMaC: Translating Actions into Motion and Contact Images for Embodied World Models

Paper • 2606.09813 • Published 15 days ago • 13

MBench: A Comprehensive Benchmark on Memory Capability for Video World Models

Paper • 2606.00793 • Published 15 days ago • 11

World Pilot: Steering Vision-Language-Action Models with World-Action Priors

Paper • 2606.12403 • Published 13 days ago • 26

Text-Vision Co-Instructed Image Editing

Paper • 2606.16767 • Published 8 days ago • 19

EgoCS-400K: An Egocentric Gameplay Dataset for World Models

Paper • 2606.18180 • Published 7 days ago • 15

Looped World Models

Paper • 2606.18208 • Published 7 days ago • 453

ProCUA-SFT Technical Report

Paper • 2606.17321 • Published 8 days ago • 8

upvoted 2 papers 4 days ago

DreamX-World 1.0: A General-Purpose Interactive World Model

Paper • 2606.16993 • Published 8 days ago • 108

BRDFusion: Physics Meets Generation for Urban Scene Inverse Rendering

Paper • 2606.17049 • Published 8 days ago • 27