思必驰获Text-to-SQL任务中文千言榜单第一名

描述

人们日常生活和工业生产中产生的海量数据被广泛存储于结构化数据库中,如何高效利用这些结构化数据成为近年学术研究和产业应用都十分关注的热点。

尽管直接编写SQL语句和数据库进行交互是目前最直接的方法,但是非计算机专业的从业人员需要耗费大量时间学习其语法,即便是SQL专家,反复编写也是单调低效的工作。

近年来基于自然语言发展起来的数据库查询接口(NLIDB)为用户与数据库进行交互提供了一种简洁高效的方法。NLIDB背后的核心技术是Text-to-SQL语义解析,其作用是在给定相应的数据库模式结构下,将用户的自然语言问句转换成SQL查询语句。

Text-to-SQL任务是自然语言处理任务中最具挑战性的任务之一,该任务的输入既要考虑用户的自然语言问题也要考虑数据库的模式结构,此外,该任务的输出是结构化的SQL语句。

登顶中文千言榜单

思必驰-上海交大人机交互联合实验室团队在继去年6月份取得Text-to-SQL任务英文基准榜单Spider第一名后,近期又取得Text-to-SQL任务中文千言榜单第一名。

千言榜单囊括了Text-to-SQL任务三个最经典的中文数据集DuSQL、NL2SQL、CSpider。本次刷榜的模型LGESQL+GTL是研究团队在之前提出的线图增强的Text-to-SQL模型LGESQL的基础上,进一步提出了结构化的动态解码方案GTL,使得模型既能很好地编码结构化的异构输入,同时也能够实现高效准确的结构化解码。

  审核编辑:彭菁
 
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分