内容标题36

  • <tr id='0vzE62'><strong id='0vzE62'></strong><small id='0vzE62'></small><button id='0vzE62'></button><li id='0vzE62'><noscript id='0vzE62'><big id='0vzE62'></big><dt id='0vzE62'></dt></noscript></li></tr><ol id='0vzE62'><option id='0vzE62'><table id='0vzE62'><blockquote id='0vzE62'><tbody id='0vzE62'></tbody></blockquote></table></option></ol><u id='0vzE62'></u><kbd id='0vzE62'><kbd id='0vzE62'></kbd></kbd>

    <code id='0vzE62'><strong id='0vzE62'></strong></code>

    <fieldset id='0vzE62'></fieldset>
          <span id='0vzE62'></span>

              <ins id='0vzE62'></ins>
              <acronym id='0vzE62'><em id='0vzE62'></em><td id='0vzE62'><div id='0vzE62'></div></td></acronym><address id='0vzE62'><big id='0vzE62'><big id='0vzE62'></big><legend id='0vzE62'></legend></big></address>

              <i id='0vzE62'><div id='0vzE62'><ins id='0vzE62'></ins></div></i>
              <i id='0vzE62'></i>
            1. <dl id='0vzE62'></dl>
              1. <blockquote id='0vzE62'><q id='0vzE62'><noscript id='0vzE62'></noscript><dt id='0vzE62'></dt></q></blockquote><noframes id='0vzE62'><i id='0vzE62'></i>
                分论坛 > 广州 > 新闻动态
                YOCSEF广深联合成功举△办大湾区IT创新论坛: 复杂大数据聚类分①析※的机遇与挑战在何处?
                2019-06-04 阅读量:1051 小字

                        2019年6月2日,YOCSEF广州分论≡坛、深圳分※论坛在广州大学城中山大学数据科学与计算机学院成功举办了“复杂大数据聚类分析的机遇与挑战在何处?”大湾区IT创新论坛。本次论坛由YOCSEF广州AC委员、华南农业大学黄栋博士,YOCSEF深圳AC委员、深圳大↑学陈小军博士共同担任执行主席。广州分论坛副主席王昌栋博士,广州分论坛主席郝天永博士深度参与,AC委员韦光、谢光强、李冠彬】等参与。论坛「共吸引了来自北京理工大学、澳门大学、中山大学、华南理工大学、华南师范大∏学、华南农业大学、广东外语外贸大学、广东工业大学、广州大学、广东药科大学、深圳大学、哈尔『滨工业大学(深圳)等十余所大湾区◣高校、深圳市卫生健康委以及多家知名IT企业的60多人参加。广州图普网络科技有限公司提供了活动赞助。


                        论坛▅分为先导报告和讨论争鸣两个阶段。先导报告阶段由陈小军博士主持。王昌栋博士以“多视图非↙线性聚类”为题,着重介绍了非线性聚类、多视图聚类以及多视图非线性聚类的理论、方法以及相关进展。陈小军ω 博士以“面向█大数据的图聚类方法”为题,阐述了在大数据场景下的图模型构建与优化及其在大数据聚类问题中的应用。张晓峰博士以“基于半监督聚类结构调整的分类方法研究”为题,论述了具备自动调整模型结构能力的半监督聚类模型。黄栋博士ζ以“从集成聚类∞到大规模聚类:有限资源下的大规模聚类问题初探”为题,从集成聚类的若干重要问题入手▲,进一步将话题○延伸至在常规单机环境下可应对千万级数据的大规模谱聚类及大规模集成聚类研究。


                 

                 

                 

                 


                        经过先导报告的多角度论述,论坛继续围绕“复杂大数据聚类的机遇与挑战”展开多个相关议题的讨论争鸣。讨论争鸣环节由黄栋博士主持,与会人∮士针对“在大数据时代下,无监督学习的重要性是更为显著,还是渐渐消退?”、“深度学习大步前∑ 进,聚类分析与之携手,还是〗各司其职?以及各司何职?”、“大数据聚类分析,最亟待解决之瓶颈是硬件、是数据、还是算法?”等三个议题进行了有理有据、针锋相对的思辨性正反方讨论。

                争鸣议题一:无监督学习的重要性是更为显著还是渐渐消退?

                        郝天永认为无监督学习的重要性会更为显著,大量数据的涌现往往伴随缺乏标签或者很难去打标签的难题,比如在医学领域和金融领域,无╳监督学习可以在无类标的情况下更好地去解决一些问题,因此“更为显著”。王昌栋则站在反方,以中山大学校园卡数据的实际项目为例,在缺少标签的情况下不同无监督模型得出的差异非常大,后来决定将无监督模型替换为了半监督模型。陈小军博士也是站在反方,提及此前做过的腾讯金融风控方』面数据,规模特㊣ 别大;仅使用无监督学习的结果,因为没有ㄨ类标◇,非常难以评价,工业界对这个结果也是有质疑的。陈小军博士补充表示,更支持↑半监督的方式,在现有的半监⌒ 督作法中,把有监督的loss函数与无监督的loss函数进行№组合是一种经典手段,但这种组合好不好也是▓他最近在思考的一个问题。对此,黄栋博士站在正方,认为少量标签信息可能使得无监⌒督模型效果大为提升,但有时候“模型设计得好不好”比“是否加少量监督信息”显得更为重要,对于一个▽好的无监督模型,甚至可能在很多数据场景下比一些半监督模型表现出更好的性能,更关键的→问题是模型本身好不好,从实验上、从数学上№有没更好的支撑。

                争鸣议题二:深度学习大步前进,聚类分析与之携手,还是各司其职?

                        陈小军表示,深度学习可以学习数据表征,之后可用常规聚类算法进行¤分析,但对聚类分析中的相似度学习没有贡献,如何运用深度学习去提升相似度学习,或者如何用深度学习对非线性可分数据得到一个线性空间下的表征,两者可以相互“携手”。中山大学邓志鸿同学赞同利用深度学习的方法来学习数据的低维表达,以此一致“携手”。对此,黄栋认为,已有“深度学习+聚类分析”相关研究,但只在图像数据△集(或高维数∴据)上实验,因为对图像这种高维度、有效特征难以提取々的复杂数据,深度学习在特征表示上的优势显现,但对于大规模低维度数据,未来也仍是“各司其职”。郝天永认为深度学〖习在特征提取和其他一些领域有非常重要的作用,携手可以目标,但路还很长,目前两者仍是各司其职。澳门大学的冯绮颖同学提到自己目前就在做深度聚类的研究,用深度学习对高维数据进行特征提取再作聚类分析确实可以得到很好的效果,但与此同时计算复杂度上升的问题、以及深度学习需要调参以改善模型效果的问题。陈小军认为聚类分∩析的初衷是无监督的,如果不恰当调参有违无监督学习本质。王昌栋认为深度模型通过特定数据调参调优之后再作聚类,一方面与无监督设定相悖,另一方面对特定领域效果很好,但推广性较差,很可能的情况是换作其他类型∴数据就出◥现很差效果。黄栋对调参问题提出不同看法,算法可分为专用算法和通用算法,专用算法对某一类数据有效,通用←算法则适用于普遍数据,两者都很有意义。广州大学姜誉博士认为深度学习与聚类分析各有【所长,深度学习有应用于聚类分析的可能,但更多地应用于其他领域,二者仍将各司其职。

                争鸣议题】三:大数据聚类分析,最亟待解决之瓶颈是硬件(算力)、是数据、还是算法?

                        陈小军认为当前最大瓶颈是算法,已有大量数据「且硬件算力非常强,例如微信支付每天十几亿的交易次数,最大瓶颈还在于算法。王昌栋※则认为,大数据聚类的最大瓶颈在于数据,应从数据分布的角度考虑,根据数据的特点来设计相应的算法。何宝华迂回怼之,“我赞同昌↓栋的结论,但我反对他的】理由!”,并呼吁从数据抽样及置信度方面进行考虑。黄栋认为在☆大数据分析中,数据规模足够大,但数据不够好,未经清洗的大规模数据其实是很难使用的,而数据清洗是非常头疼的一个问题。对此,小军笑〗而怼之曰:数据清洗不亦算法乎?遂回怼之:除了从算法入手,数据ω清洗很多时候还是需要专家知识,例如医学专家、金融专家等,专家知识可以理解为数据的范畴。围绕〗数据清洗两人互怼若干回合,但到底怼●了几回合,已经不记得。广东药科大学的傅城州博士指出,不能⌒ 因为数据不好就不去做,我们的目标是〗从数据中找出问题、并解决问题,瓶颈不在于数据,而在于能够很好解决这个ω 数据问题的算法。黄栋表示认同,炒菜炒得不好,不能怪原料,要反思的是厨艺不精!广东工业大ξ学谢光强博士提到,此前项目经验,大部分时间花在数据清洗上,但这一部分不做好又无法开展后续核心算法工作,数据的整理和清洗其实更适合让公司的人来◎做,让学者可以更专注于核心算法设计。中♂山大学李佩珍同学认为,硬件和算法同时都是最大瓶颈,算力的瓶颈不在于不够大而在于不够accessible,很多人对超算不够了解或不知如何使用。


                 

                 

                 

                 

                 

                 

                 

                 

                 

                 

                 

                 


                        论坛争鸣议题讨论后,大家◥意犹未尽,辩论了由议题︾三产生的衍生议题“数据孤岛问题”、“大数据之大,哪一大,最可怕?大样本、大维度、大噪声,还是其他之大?”,讨论联邦学习与迁移学习问题,论及♂跨医院『、跨银行的数据共ㄨ享难题。参与讨论的人员各持观点,从不同角」度进行激烈辨析,碰撞出很多思想的火花,因已超过预定时间不得不结束本次论坛,大家意犹未地继续和部分嘉宾与主持人进行讨论,本次广深联合↘大湾区IT创新论坛取得圆满成功。


                热门动态
                2018-04-11
                CCF&#32;YOCSEF广州“自动驾驶将驶向何方?”专题论坛中国计算机学会...
                2021-01-11
                2021年1月9日,南国广州寒潮已至,但YOCSEF广州分论「坛各成员热情...
                2019-06-04
                2019年6月2日,YOCSEF广州分论坛、深圳分论坛在广州大学...
                2020-10-20
                青年科研工作者作为高校的核心力量,承担着科学创新、知识传授、...
                2018-10-08
                中国计算□机学会青年计算机科技论坛-广州分论坛CCF&#32;Young&#32;Comput...
                2018-09-08
                中国计算机学会青年♀科技论坛广州分论坛CCF&#32;YOCSEF&#32;Guangzhou&#32;Bra...
                2021-03-25
                大学生是高校科研创新实践的最重要的力☆量之一,也是学术界的重要...
                2018-08-16
                中国计算机学会青年计算机科技论坛-广州分论坛CCF&#32;Young&#32;Comput...
                2018-07-02
                CCF YOCSEF广州在和安堂国医馆成功举办“健康医疗离真正智能化还...
                2018-06-24
                CCF YOCSEF广州于2018年6月23日在广东外语外贸大学成功举◥办十五...
                2017-09-17
                近期,区块链技术和比特币成为学术界和投资界的热Ψ 点,特别是最近...
                2021-08-10
                CCF&#32;Young&#32;Computer&#32;Scientists&#32;&#32;Engineers&#32;Forum&#32;Guangzhou&#32;CCF...
                2017-11-19
                2017年11月18日,CCF YOCSEF广州分论坛在中』山大学数据科学与计算...
                2016-11-21
                &#32;&#32;中国计算机学会青年计算机科技论坛&#32;CCF&#32;Young&#32;Computer&#32;Scient...
                2019-01-12
                CCF YOCSEF广州成功举办“替代未来无线网络中的路由协议”和“基...
                2020-11-11
                时间:2020年11月14日(星期六)14:00-17:30地点: 惠州城【市职业...
                2018-08-20
                CCF YOCSEF广州于2018年8月18日在仲恺农业工程学院成功举办“农...
                2018-11-05
                中国计算机学会青年计算机科技论坛-广州分论坛CCF&#32;Young&#32;Comput...
                CCF聚焦
                会员权益
                会员故事
                会员荣誉
                入会流程
                返回顶部