About me

Welcome! I am a Ph.D. student at Computer Vision for Human-Computer Interaction Lab (CV:HCI), Karlsruhe Institute of Technology (KIT), Germany, under the supervision of Prof. Rainer Stiefelhagen and Prof. Kathrin Gerling. I received my B.Sc. degree from Guangdong University of Technology (GDUT) and M.Sc. degree from KIT.

My research topic focuses on assistive technology in the background of computer vision. More specifically, I dive into computer vision for scene understanding and embodied AI, especially vision-language navigation for people with visual impairments.

For KIT students who have passion for deep learning / computer vision / embodied AI / assistive technology and are looking for a bachelor / master thesis, please don’t hesitate to contact me with your transcript and curriculum vitae.

Topics include but are not limited to:

Scene understanding, e.g., semantic / instance / panoptic segmentation
Vision and language, e.g., vision-language navigation
Embodied AI
Assistive technology
Human computer interaction

For more information about me, please check my homepage.

Open thesis and Hiwi topics

Deformable MAMBA for Wide Field of View Segmentation (Master Thesis, ongoing)
Floorplan-based Indoor Navigation for People with Visual Impairments (Bachelor Thesis, ongoing)

Teaching

Multimodal Large Language Models, SS 2024, Teaching Assistant
Computer Vision for Human-Computer Interaction, SS 2023, Teaching Assistant

Publications

@Bench: Benchmarking Vision-Language Models for Human-centered Assistive Technology Xin Jiang^*, Junwei Zheng^*, Ruiping Liu, Jiahang Li, Jiaming Zhang, Sven Matthiesen, Rainer Stiefelhagen IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) 2025 [paper] [code] [homepage]
Open Panoramic Segmentation Junwei Zheng, Ruiping Liu, Yufan Chen, Kunyu Peng, Chengzhi Wu, Kailun Yang, Jiaming Zhang, Rainer Stiefelhagen European Conference on Computer Vision (ECCV) 2024 [paper] [code] [homepage] [video]
MateRobot: Material Recognition in Wearable Robotics for People with Visual Impairments Junwei Zheng^*, Jiaming Zhang^*, Kailun Yang, Kunyu Peng, Rainer Stiefelhagen IEEE International Conference on Robotics and Automation (ICRA) 2024 (Best Paper Finalist on Human-Robot Interaction) [paper] [code] [homepage] [video]
OneBEV: Using One Panoramic Image for Bird's-Eye-View Semantic Mapping Jiale Wei, Junwei Zheng, Ruiping Liu, Jie Hu, Jiaming Zhang, Rainer Stiefelhagen Asian Conference on Computer Vision (ACCV) 2024 (Best Paper Finalist) [paper] [code]
Referring Atomic Video Action Recognition Kunyu, Peng, Jia Fu, Kailun Yang, Di Wen, Yufan Chen, Ruiping Liu, Junwei Zheng, Jiaming Zhang, M. Saquib, Sarfraz, Rainer Stiefelhagen, Alina Roitberg European Conference on Computer Vision (ECCV) 2024 [paper] [code] [video]
Skeleton-Based Human Action Recognition with Noisy Labels Yi Xu, Kunyu Peng, Di Wen, Ruiping Liu, Junwei Zheng, Yufan Chen, Jiaming Zhang, Alina Roitberg, Kailun Yang, Rainer Stiefelhagen IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 2024 [paper] [code]
RoDLA: Benchmarking the Robustness of Document Layout Analysis Models Yufan Chen, Jiaming Zhang, Kunyu Peng, Junwei Zheng, Ruiping Liu, Philip Torr, Rainer Stiefelhagen IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2024 [paper] [code] [homepage]
Navigating Open Set Scenarios for Skeleton-based Action Recognition Kunyu Peng, Cheng Yin, Junwei Zheng, Ruiping Liu, David Schneider, Jiaming Zhang, Kailun Yang, M. Saquib, Sarfraz, Rainer Stiefelhagen, Alina Roitberg AAAI Conference on Artificial Intelligence (AAAI) 2024 [paper] [code]
Fourier Prompt Tuning for Modality-Incomplete Scene Segmentation Ruiping Liu, Jiaming Zhang, Kunyu Peng, Yufan Chen, Ke Cao, Junwei Zheng, M. Saquib Sarfraz, Kailun Yang, Rainer Stiefelhagen IEEE Intelligent Vehicles Symposium (IV) 2024 [paper] [code]
Elevating Skeleton-Based Action Recognition with Efficient Multi-Modality Self-Supervision Yiping Wei, Kunyu Peng, Alina Roitberg, Jiaming Zhang, Junwei Zheng, Ruiping Liu, Yufan Chen, Kailun Yang, Rainer Stiefelhagen International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2024 [paper] [code]
Comb, Prune, Distill: Towards Unified Pruning for Vision Model Compression Jonas Schmitt, Ruiping Liu, Junwei Zheng, Jiaming Zhang, Rainer Stiefelhagen International Conference on Intelligent Transportation Systems (ITSC) 2024 (Oral) [paper] [code] [video]
Rethinking Attention Module Design for Point Cloud Analysis Chengzhi Wu, Kaige Wang, Zeyun Zhong, Hao Fu, Junwei Zheng, Jiaming Zhang, Julius Pfrommer, Jürgen Beyerer International Conference on Pattern Recognition (ICPR) 2024 [paper]
Attention-based Point Cloud Edge Sampling Chengzhi Wu, Junwei Zheng, Julius Pfrommer, Juergen Beyerer IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2023 (Highlight, Top 10%) [paper] [code] [homepage] [video]
Attention-based Part Assembly for 3D Volumetric Shape Modeling Chengzhi Wu, Junwei Zheng, Julius Pfrommer, Juergen Beyerer IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop (CVPRW) 2023 [paper] [code] [video]
Tightly-Coupled LiDAR-Visual SLAM Based on Geometric Features for Mobile Agents Ke Cao, Ruiping Liu, Ze Wang, Kunyu Peng, Jiaming Zhang, Junwei Zheng, Zhifeng Teng, Kailun Yang, Rainer Stiefelhagen IEEE/CVF International Conference on Robotics and Biomimetics (ROBIO) 2023 [paper]
Open Scene Understanding: Grounded Situation Recognition Meets Segment Anything for Helping People with Visual Impairments Ruiping Liu, Jiaming Zhang, Kunyu Peng, Junwei Zheng, Ke Cao, Yufan Chen, Kailun Yang, Rainer Stiefelhagen IEEE/CVF International Conference on Computer Vision Workshop (ICCVW) 2023 [paper] [code]
Unveiling the Hidden Realm: Self-supervised Skeleton-based Action Recognition in Occluded Environments Yifei Chen, Kunyu Peng, Alina Roitberg, David Schneider, Jiaming Zhang, Junwei Zheng, Ruiping Liu, Yufan Chen, Kailun Yang, Rainer Stiefelhagen preprint: arXiv [paper] [code]