dav: comparison libidav/davqlparser.c

-:ed21d95984bb
+:4d6b03bd7034
 // ------------------------------------------------------------------------
 #define _unexpected_end_msg "unexpected end of statement"
 #define _invalid_msg "invalid statement"
 #define _unexpected_token "unexpected token (%.*s [->]%.*s %.*s)"
+#define _missing_quote "missing closing quote symbol (%.*s)"
 static UcxList* dav_parse_tokenize(sstr_t src) {
 UcxList *tokens = NULL;
 // Delimiters: whitespace and dead whitespace around commas
 sstr_t *token = NULL;
+char insequence = '\0';
 for (size_t i = 0 ; i < src.length ; i++) {
-if (isspace(src.ptr[i])) {
+// quoted strings / identifiers are a single token
+if (src.ptr[i] == '\'' || src.ptr[i] == '`') {
+if (src.ptr[i] == insequence) {
+// add quoted token to list
+token->length++;
+tokens = ucx_list_append(tokens, token);
+token = NULL;
+insequence = '\0';
+} else if (insequence == '\0') {
+insequence = src.ptr[i];
+// always create new token for quoted strings
+if (token) {
+tokens = ucx_list_append(tokens, token);
+}
+token = malloc(sizeof(sstr_t));
+token->ptr = src.ptr + i;
+token->length = 1;
+} else {
+// add other kind of quotes to token
+token->length++;
+}
+} else if (insequence) {
+token->length++;
+} else if (isspace(src.ptr[i])) {
 // add token before spaces to list (if any)
 if (token) {
 tokens = ucx_list_append(tokens, token);
 token = NULL;
 }
 if (token) {
 tokens = ucx_list_append(tokens, token);
 }
-// now find quotes and backsticks and merge enclosed tokens
-// TODO: make it so or disable tokenization in such cases in above code
 return tokens;
 }
 #define token_sstr(listelem) ((sstr_t*)(listelem)->data)
-static DavQLExpression* dav_parse_expression(UcxList* starttoken, size_t n) {
+static DavQLExpression* dav_parse_expression(
+DavQLStatement* stmt, UcxList* starttoken, size_t n) {
 if (n == 0) {
 return NULL;
 }
 DavQLExpression *expr = calloc(1, sizeof(DavQLExpression));
 // special case - only one token
 if (n == 1) {
 expr->srctext.length = token_sstr(starttoken)->length;
 char firstchar = expr->srctext.ptr[0];
+char lastchar = expr->srctext.ptr[expr->srctext.length-1];
 if (firstchar == '\'' || isdigit(firstchar)) {
 expr->type = DAVQL_LITERAL;
 } else {
 expr->type = DAVQL_IDENTIFIER;
+}
+// remove quotes (if any)
+if (firstchar == '\'' || firstchar == '`') {
+if (lastchar != firstchar) {
+stmt->errorcode = DAVQL_ERROR_MISSING_QUOTE;
+stmt->errormessage =
+ucx_sprintf(_missing_quote, sfmtarg(expr->srctext)).ptr;
+}
+expr->srctext.ptr++;
+if (expr->srctext.length > 2) {
+expr->srctext.length -= 2;
+} else {
+expr->srctext.length = 0;
+}
 }
 } else {
 UcxList* token = starttoken;
 // check, if first token is (
 UcxList *exprstart = NULL;
 size_t exprlen = 0;
 // Process tokens
 UCX_FOREACH(token, tokens) {
+if (stmt->errorcode) {
+ultrabreak: break;
+}
 sstr_t tokendata = *token_sstr(token);
 switch (step) {
 // optional clauses
 case 520:
 case 530:
 if (!sstrcasecmp(tokendata, S("with"))) {
 step = 40;
 } else {
 dav_parse_unexpected_token(stmt, token);
-step = 999;
+goto ultrabreak;
 }
 break;
 // field list
 case 10: {
 _Bool fromkeyword = !sstrcasecmp(tokendata, S("from"));
 if (fromkeyword || !sstrcmp(tokendata, S(","))) {
 if (exprstart) {
 stmt->fields = ucx_list_append(stmt->fields,
-dav_parse_expression(exprstart, exprlen));
+dav_parse_expression(stmt, exprstart, exprlen));
 exprstart = NULL;
 exprlen = 0;
 } else {
 // TODO: throw syntax error
 }
 }
 break;
 }
 // from clause
 case 20: {
-DavQLExpression *expr = dav_parse_expression(token, 1);
+DavQLExpression *expr = dav_parse_expression(stmt, token, 1);
 stmt->path = expr->srctext;
 dav_free_expression(expr);
 step = 520;
 break;
 }

Mercurial > hg > dav / file comparison

comparison: libidav/davqlparser.c

libidav/davqlparser.c