Welcome to BDKE

大数据与知识工程实验室

实验室介绍

大数据与知识工程实验室(BDKE)致力于大数据、机器学习、软件工程等的研究、应用和学生培养;承担或参与了国家重点研发计划、国家重点专项、国家自然科学基金重点项目和面上项目、国家863、上海市重点基础研究、上海市科技攻关等以及各类企业合作项目,拥有教授、青年教师、博士后、博士研究生、硕士研究生等结构合理的研究团队。BDKE目前主要关注AI4Science、点云(Point Cloud)、知识图谱(Knowledge Graph)、大语言模型及其应用、数据湖(Data Lake)、时间序列大数据分析(Big data based Time-Series Analysi)、软件工程与机器学习。实验室毕业的学生就职于微软、阿里、蚂蚁金服、字节跳动、爱奇艺、摩根士丹利、华为、事业单位、高等院校、央企/国企等。

研究小组


点云(Point Cloud)
研究点云配准、补全、目标检测、语义分割等,目前致力于大规模点云预训练在自动驾驶与机器人领域的应用。 本课题组近年来致力于研究点云处理相关技术。由于真实采集的点云数据广泛存在噪声,缺陷等问题,首先需要经过点云去噪,补全或者上采样等手段提升真实采集的点云质量。通过这些任务所获得的点云数据可以进一步处理下游任务如点云检测,语义分割,点云分类以及追踪等任务。此外,点云的标注费时费力,本课题组旨在从点云预训练角度出发,利用大量无标注的点云数据设计自监督任务进行预训练,这些模型可以以较低的标注、训练代价迁移至下游任务。这一系列工作所涉及的技术可以应用到如机器人,自动驾驶等领域,具有一定的产学研结合前景。本课题组欢迎对此方向感兴趣的同学加入,共同探究点云处理中有意义且有价值的问题!
AI4Science
基于人工智能的医疗、海洋、航空等领域的技术和应用。
知识图谱(Knowledge Graph)
研究多模态知识图谱的构建,知识抽取,知识补全,知识链接;事件知识抽取,因果、时序、反事实关系抽取及问答。
大语言模型及其应用
本方向针对应用领域的大语言模型的架构、微调和知识增强等。
“基于深度学习的时间序列数据分析””健康管理”
研究数据驱动的故障检测、诊断、预测算法及其在工业界的应用和验证。不同工业应用中的时间序列数据自身所具有的非稳态、周期和趋势等特性,对深度学习模型在实际场景中的广泛应用、以及模型在长期部署环境中的性能一致性形成了较大的挑战。如何构建评估算法性能、可靠性的数据集,并以此设计具备实用性的深度学习模型,不仅对真正解决应用问题至关重要,还可以启发对于算法本身的范式创新。
“数据湖”
研究元数据管理、数据发现、交互式数据分析等。数据湖管理包含:数据抽取、数据清洗、数据集成、数据版本控制、元数据管理。数据湖对于企业和科研都有广泛的应用场景,而有效的数据湖管理能有效减少错误传播,为后期数据集成、数据发现等任务提供高质量的输入,从而最大限度发挥原始数据的价值。
软件开发与机器学习
研究软件开发生命周期活动中机器学习方法的应用,建立新型软件工程开发框架。

新闻


  • 实验室论文 L Ma, Weidong Yang∗, B Xu, S Jiang, B Fei, J Liang, M Zhou, Y Xiao. KnowLog: Knowledge Enhanced Pre-trained Language Model for Log Understanding. 2024 IEEE/ACM 46th International Conference on Software Engineering (ICSE 2024)
  • 实验室论文 Z Tan, Weidong Yang∗, Z Zhang. PyraBiNet: A Hybrid Semantic Segmentation Network Combining PVT and BiSeNet for Deformable Objects in Indoor Environments. International Conference on Neural Information Processing 2023, 552-564
  • 实验室论文 Z Tan, Weidong Yang∗, Z Zhang. DOS Dataset: A Novel Indoor Deformable Object Segmentation Dataset for Sweeping Robots. International Conference on Neural Information Processing 2023, 352-366.
  • 实验室论文 Shuhao Li, Yue Cui, Yan Zhao, Weidong Yang∗, Ruiyuan Zhang, Xiaofang Zhou. ST-MoE: Spatio-Temporal Mixture-of-Experts for Debiasing in Traffic Prediction. Proceedings of the 32nd ACM International Conference on Information and Knowledge Management (CIKM2023)
  • 实验室论文 Mingyu Zhao, Weidong Yang∗, Feiping Nie. Deep graph reconstruction for multi-view clustering. Neural Networks, Volume 168, November 2023, Pages 560-568
  • 实验室论文 Mingyu Zhao, Weidong Yang∗, Feiping Nie. Transformer-Based Contrastive Multi-view Clustering via Ensembles. Joint European Conference on Machine Learning and Knowledge Discovery in Databases, ECML PKDD 2023: Machine Learning and Knowledge Discovery in Databases: Research Track pp 678–694
  • 实验室论文 Mingyu Zhao, Weidong Yang, Feiping Nie. MVCformer: A Transformer-based Multi-view Clustering Method. Information Sciences, Volume 649, November 2023, 119622
  • 实验室论文 Mingyu Zhao, Weidong Yang, Feiping Nie. Deep multi-view spectral clustering via ensemble. Pattern Recognition, Volume 144, December 2023, 109836.
  • 实验室论文 Mingyu Zhao* , Weidong Yang∗, Feiping Nie*. Auto-weighted Orthogonal and Nonnegative Graph Reconstruction for Multi-view Clustering. INFORMATION SCIENCES. Information Sciences 632, 324-339
  • 实验室论文 Z Tan, M Zhao, Y Wang, Weidong Yang∗. Multivariate Time Series Retrieval with Binary Coding from Transformer. Neural Information Processing: 29th International Conference, ICONIP 2022
  • 实验室论文 Ben Fei, Weidong Yang*, VQ-DcTr: Vector-Quantized Autoencoder with Dual-channel Transformer Points Splitting for 3D Point Cloud Completion, 30th ACM International Conference on Multimedia, ACMMM 2022.
  • 实验室论文 Ben Fei, Weidong Yang*, Wenming Chen , Xing Hu , Lipeng Ma. HFF-NET: HIERARCHICAL FEATURE FUSION NETWORK FOR POINT CLOUD GENERATION WITH POINT TRANSFORMERS. 2022 IEEE International Conference on Multimedia and Expo, (ICME 2022)
  • 实验室论文 Ben Fei, Weidong Yang, Lipeng Ma, Wen-Ming Chen. DcTr: Noise-robust point cloud completion by dual-channel transformer with cross-attention. Pattern Recognition | Vol 133, January 2023.
  • 实验室论文 Ben Fei, Weidong Yang*, etc. Comprehensive Review of Deep Learning-Based 3D Point Cloud Completion Processing and Analysis. IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, VOL. 23, NO. 12, DECEMBER 2022
  • 实验室论文 B Fei, Z Lyu, L Pan, J Zhang, W Yang, T Luo, B Zhang, B Dai . Generative Diffusion Prior for Unified Image Restoration and Enhancement. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern
  • 实验室论文“Bayesian Robust Tensor Completion via CP Decomposition”(王小航等)被. Pattern Recognition Letters录用。

  • 更多