编辑MaxCompute SQL 时,经常会需要在某个表N个列中指定一些列。若需要指定的列比较少,编写SQL时一个个输入既可。当遇到列多的时候,一个个输入就会非常费劲。本文将介绍如何在编写MaxCompute SQL时通过正则表达式表达列(column),从而提升编码效率。

首先用一个简单的示例介绍正则表达式的使用方法:

如上示例,使用了正则表达式"abc.*",在MaxCompute SQL中,正则表达式需要使用 ` 符号括起来,这个符号是键盘上 1 键左边的那个键,称做反单引号(注意需英文模式输入) 。

正则表达选列的一个非常重要的用法是,使用反选的方式来选列。如:

类似的用法还有:

(ds|pt)?+.+ 排除两列.

(d.*)?+.+ 排除名字以d打头的所有列.

注意:在排除多个列的时候,如果col2是col1的前缀,则一定要把col1写到col2的前面(长的写前面)。比如一个表有2个分区你不想select,一个叫ds,另一个叫dshh,那么要写成 (dshh|ds)?+.+ ,而不能写成 (ds|dshh)?+.+ 。

------------------------------

本文作者:海清

原文链接:https://yq.aliyun.com/articles/697155?utm_content=g_1000052497

本文为云栖社区原创内容,未经允许不得转载。

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
相关文章