]> git.cameronkatri.com Git - mandoc.git/blobdiff - mdoc_argv.c
Keep words after .Ic together in a single argument.
[mandoc.git] / mdoc_argv.c
index fa271a50070dbcb509651cf86c69b5c5f797f075..bb9bc6c339b788980fbe37ae70cffa34c93a1c3e 100644 (file)
@@ -1,6 +1,7 @@
-/*     $Id: mdoc_argv.c,v 1.79 2011/06/18 16:29:38 kristaps Exp $ */
+/*     $Id: mdoc_argv.c,v 1.89 2013/12/25 00:50:05 schwarze Exp $ */
 /*
- * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>
+ * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
+ * Copyright (c) 2012 Ingo Schwarze <schwarze@openbsd.org>
  *
  * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above
@@ -21,7 +22,6 @@
 #include <sys/types.h>
 
 #include <assert.h>
-#include <ctype.h>
 #include <stdlib.h>
 #include <stdio.h>
 #include <string.h>
@@ -43,8 +43,7 @@ enum  argsflag {
 enum   argvflag {
        ARGV_NONE, /* no args to flag (e.g., -split) */
        ARGV_SINGLE, /* one arg to flag (e.g., -file xxx)  */
-       ARGV_MULTI, /* multiple args (e.g., -column xxx yyy) */
-       ARGV_OPT_SINGLE /* optional arg (e.g., -offset [xxx]) */
+       ARGV_MULTI /* multiple args (e.g., -column xxx yyy) */
 };
 
 struct mdocarg {
@@ -52,16 +51,14 @@ struct      mdocarg {
        const enum mdocargt *argvs;
 };
 
+static void             argn_free(struct mdoc_arg *, int);
 static enum margserr    args(struct mdoc *, int, int *, 
                                char *, enum argsflag, char **);
 static int              args_checkpunct(const char *, int);
-static int              argv_single(struct mdoc *, int, 
-                               struct mdoc_argv *, int *, char *);
-static int              argv_opt_single(struct mdoc *, int, 
-                               struct mdoc_argv *, int *, char *);
 static int              argv_multi(struct mdoc *, int, 
                                struct mdoc_argv *, int *, char *);
-static void             argn_free(struct mdoc_arg *, int);
+static int              argv_single(struct mdoc *, int, 
+                               struct mdoc_argv *, int *, char *);
 
 static const enum argvflag argvflags[MDOC_ARG_MAX] = {
        ARGV_NONE,      /* MDOC_Split */
@@ -70,7 +67,7 @@ static        const enum argvflag argvflags[MDOC_ARG_MAX] = {
        ARGV_NONE,      /* MDOC_Unfilled */
        ARGV_NONE,      /* MDOC_Literal */
        ARGV_SINGLE,    /* MDOC_File */
-       ARGV_OPT_SINGLE, /* MDOC_Offset */
+       ARGV_SINGLE,    /* MDOC_Offset */
        ARGV_NONE,      /* MDOC_Bullet */
        ARGV_NONE,      /* MDOC_Dash */
        ARGV_NONE,      /* MDOC_Hyphen */
@@ -147,7 +144,7 @@ static      const enum mdocargt args_Bl[] = {
 };
 
 static const struct mdocarg mdocargs[MDOC_MAX] = {
-       { ARGSFL_NONE, NULL }, /* Ap */
+       { ARGSFL_DELIM, NULL }, /* Ap */
        { ARGSFL_NONE, NULL }, /* Dd */
        { ARGSFL_NONE, NULL }, /* Dt */
        { ARGSFL_NONE, NULL }, /* Os */
@@ -164,7 +161,7 @@ static      const struct mdocarg mdocargs[MDOC_MAX] = {
        { ARGSFL_DELIM, NULL }, /* Ad */ 
        { ARGSFL_DELIM, args_An }, /* An */
        { ARGSFL_DELIM, NULL }, /* Ar */
-       { ARGSFL_NONE, NULL }, /* Cd */
+       { ARGSFL_DELIM, NULL }, /* Cd */
        { ARGSFL_DELIM, NULL }, /* Cm */
        { ARGSFL_DELIM, NULL }, /* Dv */ 
        { ARGSFL_DELIM, NULL }, /* Er */ 
@@ -176,7 +173,7 @@ static      const struct mdocarg mdocargs[MDOC_MAX] = {
        { ARGSFL_DELIM, NULL }, /* Fn */ 
        { ARGSFL_DELIM, NULL }, /* Ft */ 
        { ARGSFL_DELIM, NULL }, /* Ic */ 
-       { ARGSFL_NONE, NULL }, /* In */ 
+       { ARGSFL_DELIM, NULL }, /* In */ 
        { ARGSFL_DELIM, NULL }, /* Li */
        { ARGSFL_NONE, NULL }, /* Nd */ 
        { ARGSFL_DELIM, NULL }, /* Nm */ 
@@ -244,7 +241,7 @@ static      const struct mdocarg mdocargs[MDOC_MAX] = {
        { ARGSFL_DELIM, NULL }, /* Xc */
        { ARGSFL_NONE, NULL }, /* Xo */
        { ARGSFL_NONE, NULL }, /* Fo */ 
-       { ARGSFL_NONE, NULL }, /* Fc */ 
+       { ARGSFL_DELIM, NULL }, /* Fc */ 
        { ARGSFL_NONE, NULL }, /* Oo */
        { ARGSFL_DELIM, NULL }, /* Oc */
        { ARGSFL_NONE, args_Bk }, /* Bk */
@@ -253,7 +250,7 @@ static      const struct mdocarg mdocargs[MDOC_MAX] = {
        { ARGSFL_NONE, NULL }, /* Hf */
        { ARGSFL_NONE, NULL }, /* Fr */
        { ARGSFL_NONE, NULL }, /* Ud */
-       { ARGSFL_NONE, NULL }, /* Lb */
+       { ARGSFL_DELIM, NULL }, /* Lb */
        { ARGSFL_NONE, NULL }, /* Lp */
        { ARGSFL_DELIM, NULL }, /* Lk */
        { ARGSFL_DELIM, NULL }, /* Mt */
@@ -263,7 +260,7 @@ static      const struct mdocarg mdocargs[MDOC_MAX] = {
        { ARGSFL_NONE, NULL }, /* %C */
        { ARGSFL_NONE, NULL }, /* Es */
        { ARGSFL_NONE, NULL }, /* En */
-       { ARGSFL_NONE, NULL }, /* Dx */
+       { ARGSFL_DELIM, NULL }, /* Dx */
        { ARGSFL_NONE, NULL }, /* %Q */
        { ARGSFL_NONE, NULL }, /* br */
        { ARGSFL_NONE, NULL }, /* sp */
@@ -278,7 +275,7 @@ static      const struct mdocarg mdocargs[MDOC_MAX] = {
  * one mandatory value, an optional single value, or no value.
  */
 enum margverr
-mdoc_argv(struct mdoc *m, int line, enum mdoct tok,
+mdoc_argv(struct mdoc *mdoc, int line, enum mdoct tok,
                struct mdoc_arg **v, int *pos, char *buf)
 {
        char             *p, sv;
@@ -290,8 +287,8 @@ mdoc_argv(struct mdoc *m, int line, enum mdoct tok,
                return(ARGV_EOLN);
        else if (NULL == (ap = mdocargs[tok].argvs))
                return(ARGV_WORD);
-
-       assert(' ' != buf[*pos]);
+       else if ('-' != buf[*pos])
+               return(ARGV_WORD);
 
        /* Seek to the first unescaped space. */
 
@@ -345,15 +342,11 @@ mdoc_argv(struct mdoc *m, int line, enum mdoct tok,
 
        switch (argvflags[tmp.arg]) {
        case (ARGV_SINGLE):
-               if ( ! argv_single(m, line, &tmp, pos, buf))
+               if ( ! argv_single(mdoc, line, &tmp, pos, buf))
                        return(ARGV_ERROR);
                break;
        case (ARGV_MULTI):
-               if ( ! argv_multi(m, line, &tmp, pos, buf))
-                       return(ARGV_ERROR);
-               break;
-       case (ARGV_OPT_SINGLE):
-               if ( ! argv_opt_single(m, line, &tmp, pos, buf))
+               if ( ! argv_multi(mdoc, line, &tmp, pos, buf))
                        return(ARGV_ERROR);
                break;
        case (ARGV_NONE):
@@ -414,14 +407,14 @@ argn_free(struct mdoc_arg *p, int iarg)
 }
 
 enum margserr
-mdoc_zargs(struct mdoc *m, int line, int *pos, char *buf, char **v)
+mdoc_zargs(struct mdoc *mdoc, int line, int *pos, char *buf, char **v)
 {
 
-       return(args(m, line, pos, buf, ARGSFL_NONE, v));
+       return(args(mdoc, line, pos, buf, ARGSFL_NONE, v));
 }
 
 enum margserr
-mdoc_args(struct mdoc *m, int line, int *pos, 
+mdoc_args(struct mdoc *mdoc, int line, int *pos, 
                char *buf, enum mdoct tok, char **v)
 {
        enum argsflag     fl;
@@ -430,7 +423,7 @@ mdoc_args(struct mdoc *m, int line, int *pos,
        fl = mdocargs[tok].flags;
 
        if (MDOC_It != tok)
-               return(args(m, line, pos, buf, fl, v));
+               return(args(mdoc, line, pos, buf, fl, v));
 
        /*
         * We know that we're in an `It', so it's reasonable to expect
@@ -439,35 +432,36 @@ mdoc_args(struct mdoc *m, int line, int *pos,
         * safe fall-back into the default behaviour.
         */
 
-       for (n = m->last; n; n = n->parent)
+       for (n = mdoc->last; n; n = n->parent)
                if (MDOC_Bl == n->tok)
                        if (LIST_column == n->norm->Bl.type) {
                                fl = ARGSFL_TABSEP;
                                break;
                        }
 
-       return(args(m, line, pos, buf, fl, v));
+       return(args(mdoc, line, pos, buf, fl, v));
 }
 
 static enum margserr
-args(struct mdoc *m, int line, int *pos, 
+args(struct mdoc *mdoc, int line, int *pos, 
                char *buf, enum argsflag fl, char **v)
 {
        char            *p, *pp;
+       int              pairs;
        enum margserr    rc;
 
        if ('\0' == buf[*pos]) {
-               if (MDOC_PPHRASE & m->flags)
+               if (MDOC_PPHRASE & mdoc->flags)
                        return(ARGS_EOLN);
                /*
                 * If we're not in a partial phrase and the flag for
                 * being a phrase literal is still set, the punctuation
                 * is unterminated.
                 */
-               if (MDOC_PHRASELIT & m->flags)
-                       mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE);
+               if (MDOC_PHRASELIT & mdoc->flags)
+                       mdoc_pmsg(mdoc, line, *pos, MANDOCERR_BADQUOTE);
 
-               m->flags &= ~MDOC_PHRASELIT;
+               mdoc->flags &= ~MDOC_PHRASELIT;
                return(ARGS_EOLN);
        }
 
@@ -490,7 +484,7 @@ args(struct mdoc *m, int line, int *pos,
                pp = NULL;
 
                /* Scan ahead to unescaped `Ta'. */
-               if ( ! (MDOC_PHRASELIT & m->flags)) 
+               if ( ! (MDOC_PHRASELIT & mdoc->flags)) 
                        for (pp = *v; ; pp++) {
                                if (NULL == (pp = strstr(pp, "Ta")))
                                        break;
@@ -524,7 +518,7 @@ args(struct mdoc *m, int line, int *pos,
 
                /* Whitespace check for eoln case... */
                if ('\0' == *p && ' ' == *(p - 1))
-                       mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);
+                       mdoc_pmsg(mdoc, line, *pos, MANDOCERR_EOLNSPACE);
 
                *pos += (int)(p - *v);
 
@@ -542,37 +536,48 @@ args(struct mdoc *m, int line, int *pos,
                        /* Skip ahead. */ ;
 
                return(rc);
-       } 
+       }
 
-       /* 
+       /*
         * Process a quoted literal.  A quote begins with a double-quote
         * and ends with a double-quote NOT preceded by a double-quote.
+        * NUL-terminate the literal in place.
+        * Collapse pairs of quotes inside quoted literals.
         * Whitespace is NOT involved in literal termination.
         */
 
-       if (MDOC_PHRASELIT & m->flags || '\"' == buf[*pos]) {
-               if ( ! (MDOC_PHRASELIT & m->flags))
+       if (MDOC_PHRASELIT & mdoc->flags || '\"' == buf[*pos]) {
+               if ( ! (MDOC_PHRASELIT & mdoc->flags))
                        *v = &buf[++(*pos)];
 
-               if (MDOC_PPHRASE & m->flags)
-                       m->flags |= MDOC_PHRASELIT;
+               if (MDOC_PPHRASE & mdoc->flags)
+                       mdoc->flags |= MDOC_PHRASELIT;
 
+               pairs = 0;
                for ( ; buf[*pos]; (*pos)++) {
+                       /* Move following text left after quoted quotes. */
+                       if (pairs)
+                               buf[*pos - pairs] = buf[*pos];
                        if ('\"' != buf[*pos])
                                continue;
+                       /* Unquoted quotes end quoted args. */
                        if ('\"' != buf[*pos + 1])
                                break;
+                       /* Quoted quotes collapse. */
+                       pairs++;
                        (*pos)++;
                }
+               if (pairs)
+                       buf[*pos - pairs] = '\0';
 
                if ('\0' == buf[*pos]) {
-                       if (MDOC_PPHRASE & m->flags)
+                       if (MDOC_PPHRASE & mdoc->flags)
                                return(ARGS_QWORD);
-                       mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE);
+                       mdoc_pmsg(mdoc, line, *pos, MANDOCERR_BADQUOTE);
                        return(ARGS_QWORD);
                }
 
-               m->flags &= ~MDOC_PHRASELIT;
+               mdoc->flags &= ~MDOC_PHRASELIT;
                buf[(*pos)++] = '\0';
 
                if ('\0' == buf[*pos])
@@ -582,13 +587,13 @@ args(struct mdoc *m, int line, int *pos,
                        (*pos)++;
 
                if ('\0' == buf[*pos])
-                       mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);
+                       mdoc_pmsg(mdoc, line, *pos, MANDOCERR_EOLNSPACE);
 
                return(ARGS_QWORD);
        }
 
        p = &buf[*pos];
-       *v = mandoc_getarg(m->parse, &p, line, pos);
+       *v = mandoc_getarg(mdoc->parse, &p, line, pos);
 
        return(ARGS_WORD);
 }
@@ -644,7 +649,7 @@ args_checkpunct(const char *buf, int i)
 }
 
 static int
-argv_multi(struct mdoc *m, int line, 
+argv_multi(struct mdoc *mdoc, int line, 
                struct mdoc_argv *v, int *pos, char *buf)
 {
        enum margserr    ac;
@@ -653,7 +658,7 @@ argv_multi(struct mdoc *m, int line,
        for (v->sz = 0; ; v->sz++) {
                if ('-' == buf[*pos])
                        break;
-               ac = args(m, line, pos, buf, ARGSFL_NONE, &p);
+               ac = args(mdoc, line, pos, buf, ARGSFL_NONE, &p);
                if (ARGS_ERROR == ac)
                        return(0);
                else if (ARGS_EOLN == ac)
@@ -670,16 +675,13 @@ argv_multi(struct mdoc *m, int line,
 }
 
 static int
-argv_opt_single(struct mdoc *m, int line, 
+argv_single(struct mdoc *mdoc, int line, 
                struct mdoc_argv *v, int *pos, char *buf)
 {
        enum margserr    ac;
        char            *p;
 
-       if ('-' == buf[*pos])
-               return(1);
-
-       ac = args(m, line, pos, buf, ARGSFL_NONE, &p);
+       ac = args(mdoc, line, pos, buf, ARGSFL_NONE, &p);
        if (ARGS_ERROR == ac)
                return(0);
        if (ARGS_EOLN == ac)
@@ -691,27 +693,3 @@ argv_opt_single(struct mdoc *m, int line,
 
        return(1);
 }
-
-static int
-argv_single(struct mdoc *m, int line, 
-               struct mdoc_argv *v, int *pos, char *buf)
-{
-       int              ppos;
-       enum margserr    ac;
-       char            *p;
-
-       ppos = *pos;
-
-       ac = args(m, line, pos, buf, ARGSFL_NONE, &p);
-       if (ARGS_EOLN == ac) {
-               mdoc_pmsg(m, line, ppos, MANDOCERR_SYNTARGVCOUNT);
-               return(0);
-       } else if (ARGS_ERROR == ac)
-               return(0);
-
-       v->sz = 1;
-       v->value = mandoc_malloc(sizeof(char *));
-       v->value[0] = mandoc_strdup(p);
-
-       return(1);
-}