]> git.cameronkatri.com Git - mandoc.git/blobdiff - mdoc_argv.c
Fix a regression caused by the insertion of two new tokens,
[mandoc.git] / mdoc_argv.c
index b68d2c74472c617fca72261a2f9534abdbdb5ea0..1bfd336b7a972cf81c202ec38b8c92363f37203d 100644 (file)
@@ -1,71 +1,74 @@
-/*     $Id: mdoc_argv.c,v 1.41 2010/05/07 06:05:38 kristaps Exp $ */
+/*     $Id: mdoc_argv.c,v 1.120 2019/07/11 17:06:17 schwarze Exp $ */
 /*
- * Copyright (c) 2008, 2009 Kristaps Dzonsons <kristaps@kth.se>
+ * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
+ * Copyright (c) 2012, 2014-2019 Ingo Schwarze <schwarze@openbsd.org>
  *
  * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above
  * copyright notice and this permission notice appear in all copies.
  *
- * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
+ * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
- * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
+ * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  */
-#ifdef HAVE_CONFIG_H
 #include "config.h"
-#endif
 
 #include <sys/types.h>
 
 #include <assert.h>
-#include <ctype.h>
 #include <stdlib.h>
 #include <stdio.h>
 #include <string.h>
 
-#include "libmdoc.h"
+#include "mandoc_aux.h"
+#include "mandoc.h"
+#include "roff.h"
+#include "mdoc.h"
 #include "libmandoc.h"
+#include "roff_int.h"
+#include "libmdoc.h"
 
-/*
- * Routines to parse arguments of macros.  Arguments follow the syntax
- * of `-arg [val [valN...]]'.  Arguments come in all types:  quoted
- * arguments, multiple arguments per value, no-value arguments, etc.
- *
- * There's no limit to the number or arguments that may be allocated.
- */
+#define        MULTI_STEP       5 /* pre-allocate argument values */
+#define        DELIMSZ          6 /* max possible size of a delimiter */
 
-#define        ARGV_NONE       (1 << 0)
-#define        ARGV_SINGLE     (1 << 1)
-#define        ARGV_MULTI      (1 << 2)
-#define        ARGV_OPT_SINGLE (1 << 3)
+enum   argsflag {
+       ARGSFL_NONE = 0,
+       ARGSFL_DELIM, /* handle delimiters of [[::delim::][ ]+]+ */
+       ARGSFL_TABSEP /* handle tab/`Ta' separated phrases */
+};
 
-#define        MULTI_STEP       5
+enum   argvflag {
+       ARGV_NONE, /* no args to flag (e.g., -split) */
+       ARGV_SINGLE, /* one arg to flag (e.g., -file xxx)  */
+       ARGV_MULTI /* multiple args (e.g., -column xxx yyy) */
+};
 
-static int              argv_a2arg(enum mdoct, const char *);
-static enum margserr    args(struct mdoc *, int, int *, 
-                               char *, int, char **);
-static int              argv(struct mdoc *, int, 
-                               struct mdoc_argv *, int *, char *);
-static int              argv_single(struct mdoc *, int, 
-                               struct mdoc_argv *, int *, char *);
-static int              argv_opt_single(struct mdoc *, int, 
+struct mdocarg {
+       enum argsflag    flags;
+       const enum mdocargt *argvs;
+};
+
+static void             argn_free(struct mdoc_arg *, int);
+static enum margserr    args(struct roff_man *, int, int *,
+                               char *, enum argsflag, char **);
+static int              args_checkpunct(const char *, int);
+static void             argv_multi(struct roff_man *, int,
                                struct mdoc_argv *, int *, char *);
-static int              argv_multi(struct mdoc *, int, 
+static void             argv_single(struct roff_man *, int,
                                struct mdoc_argv *, int *, char *);
 
-/* Per-argument flags. */
-
-static int mdoc_argvflags[MDOC_ARG_MAX] = {
+static const enum argvflag argvflags[MDOC_ARG_MAX] = {
        ARGV_NONE,      /* MDOC_Split */
        ARGV_NONE,      /* MDOC_Nosplit */
        ARGV_NONE,      /* MDOC_Ragged */
        ARGV_NONE,      /* MDOC_Unfilled */
        ARGV_NONE,      /* MDOC_Literal */
        ARGV_SINGLE,    /* MDOC_File */
-       ARGV_OPT_SINGLE, /* MDOC_Offset */
+       ARGV_SINGLE,    /* MDOC_Offset */
        ARGV_NONE,      /* MDOC_Bullet */
        ARGV_NONE,      /* MDOC_Dash */
        ARGV_NONE,      /* MDOC_Hyphen */
@@ -87,203 +90,286 @@ static    int mdoc_argvflags[MDOC_ARG_MAX] = {
        ARGV_NONE       /* MDOC_Symbolic */
 };
 
-static int mdoc_argflags[MDOC_MAX] = {
-       0, /* Ap */
-       0, /* Dd */
-       0, /* Dt */
-       0, /* Os */
-       0, /* Sh */
-       0, /* Ss */ 
-       ARGS_DELIM, /* Pp */ 
-       ARGS_DELIM, /* D1 */
-       ARGS_DELIM, /* Dl */
-       0, /* Bd */
-       0, /* Ed */
-       0, /* Bl */
-       0, /* El */
-       0, /* It */
-       ARGS_DELIM, /* Ad */ 
-       ARGS_DELIM, /* An */
-       ARGS_DELIM, /* Ar */
-       0, /* Cd */
-       ARGS_DELIM, /* Cm */
-       ARGS_DELIM, /* Dv */ 
-       ARGS_DELIM, /* Er */ 
-       ARGS_DELIM, /* Ev */ 
-       0, /* Ex */
-       ARGS_DELIM, /* Fa */ 
-       0, /* Fd */ 
-       ARGS_DELIM, /* Fl */
-       ARGS_DELIM, /* Fn */ 
-       ARGS_DELIM, /* Ft */ 
-       ARGS_DELIM, /* Ic */ 
-       0, /* In */ 
-       ARGS_DELIM, /* Li */
-       0, /* Nd */ 
-       ARGS_DELIM, /* Nm */ 
-       ARGS_DELIM, /* Op */
-       0, /* Ot */
-       ARGS_DELIM, /* Pa */
-       0, /* Rv */
-       ARGS_DELIM, /* St */ 
-       ARGS_DELIM, /* Va */
-       ARGS_DELIM, /* Vt */ 
-       ARGS_DELIM, /* Xr */
-       0, /* %A */
-       0, /* %B */
-       0, /* %D */
-       0, /* %I */
-       0, /* %J */
-       0, /* %N */
-       0, /* %O */
-       0, /* %P */
-       0, /* %R */
-       0, /* %T */
-       0, /* %V */
-       ARGS_DELIM, /* Ac */
-       0, /* Ao */
-       ARGS_DELIM, /* Aq */
-       ARGS_DELIM, /* At */
-       ARGS_DELIM, /* Bc */
-       0, /* Bf */ 
-       0, /* Bo */
-       ARGS_DELIM, /* Bq */
-       ARGS_DELIM, /* Bsx */
-       ARGS_DELIM, /* Bx */
-       0, /* Db */
-       ARGS_DELIM, /* Dc */
-       0, /* Do */
-       ARGS_DELIM, /* Dq */
-       ARGS_DELIM, /* Ec */
-       0, /* Ef */
-       ARGS_DELIM, /* Em */ 
-       0, /* Eo */
-       ARGS_DELIM, /* Fx */
-       ARGS_DELIM, /* Ms */
-       ARGS_DELIM, /* No */
-       ARGS_DELIM, /* Ns */
-       ARGS_DELIM, /* Nx */
-       ARGS_DELIM, /* Ox */
-       ARGS_DELIM, /* Pc */
-       ARGS_DELIM, /* Pf */
-       0, /* Po */
-       ARGS_DELIM, /* Pq */
-       ARGS_DELIM, /* Qc */
-       ARGS_DELIM, /* Ql */
-       0, /* Qo */
-       ARGS_DELIM, /* Qq */
-       0, /* Re */
-       0, /* Rs */
-       ARGS_DELIM, /* Sc */
-       0, /* So */
-       ARGS_DELIM, /* Sq */
-       0, /* Sm */
-       ARGS_DELIM, /* Sx */
-       ARGS_DELIM, /* Sy */
-       ARGS_DELIM, /* Tn */
-       ARGS_DELIM, /* Ux */
-       ARGS_DELIM, /* Xc */
-       0, /* Xo */
-       0, /* Fo */ 
-       0, /* Fc */ 
-       0, /* Oo */
-       ARGS_DELIM, /* Oc */
-       0, /* Bk */
-       0, /* Ek */
-       0, /* Bt */
-       0, /* Hf */
-       0, /* Fr */
-       0, /* Ud */
-       0, /* Lb */
-       ARGS_DELIM, /* Lp */
-       ARGS_DELIM, /* Lk */
-       ARGS_DELIM, /* Mt */
-       ARGS_DELIM, /* Brq */
-       0, /* Bro */
-       ARGS_DELIM, /* Brc */
-       0, /* %C */
-       0, /* Es */
-       0, /* En */
-       0, /* Dx */
-       0, /* %Q */
-       0, /* br */
-       0, /* sp */
-       0, /* %U */
+static const enum mdocargt args_Ex[] = {
+       MDOC_Std,
+       MDOC_ARG_MAX
+};
+
+static const enum mdocargt args_An[] = {
+       MDOC_Split,
+       MDOC_Nosplit,
+       MDOC_ARG_MAX
+};
+
+static const enum mdocargt args_Bd[] = {
+       MDOC_Ragged,
+       MDOC_Unfilled,
+       MDOC_Filled,
+       MDOC_Literal,
+       MDOC_File,
+       MDOC_Offset,
+       MDOC_Compact,
+       MDOC_Centred,
+       MDOC_ARG_MAX
+};
+
+static const enum mdocargt args_Bf[] = {
+       MDOC_Emphasis,
+       MDOC_Literal,
+       MDOC_Symbolic,
+       MDOC_ARG_MAX
+};
+
+static const enum mdocargt args_Bk[] = {
+       MDOC_Words,
+       MDOC_ARG_MAX
+};
+
+static const enum mdocargt args_Bl[] = {
+       MDOC_Bullet,
+       MDOC_Dash,
+       MDOC_Hyphen,
+       MDOC_Item,
+       MDOC_Enum,
+       MDOC_Tag,
+       MDOC_Diag,
+       MDOC_Hang,
+       MDOC_Ohang,
+       MDOC_Inset,
+       MDOC_Column,
+       MDOC_Width,
+       MDOC_Offset,
+       MDOC_Compact,
+       MDOC_Nested,
+       MDOC_ARG_MAX
+};
+
+static const struct mdocarg mdocargs[MDOC_MAX - MDOC_Dd] = {
+       { ARGSFL_NONE, NULL }, /* Dd */
+       { ARGSFL_NONE, NULL }, /* Dt */
+       { ARGSFL_NONE, NULL }, /* Os */
+       { ARGSFL_NONE, NULL }, /* Sh */
+       { ARGSFL_NONE, NULL }, /* Ss */
+       { ARGSFL_NONE, NULL }, /* Pp */
+       { ARGSFL_DELIM, NULL }, /* D1 */
+       { ARGSFL_DELIM, NULL }, /* Dl */
+       { ARGSFL_NONE, args_Bd }, /* Bd */
+       { ARGSFL_NONE, NULL }, /* Ed */
+       { ARGSFL_NONE, args_Bl }, /* Bl */
+       { ARGSFL_NONE, NULL }, /* El */
+       { ARGSFL_NONE, NULL }, /* It */
+       { ARGSFL_DELIM, NULL }, /* Ad */
+       { ARGSFL_DELIM, args_An }, /* An */
+       { ARGSFL_DELIM, NULL }, /* Ap */
+       { ARGSFL_DELIM, NULL }, /* Ar */
+       { ARGSFL_DELIM, NULL }, /* Cd */
+       { ARGSFL_DELIM, NULL }, /* Cm */
+       { ARGSFL_DELIM, NULL }, /* Dv */
+       { ARGSFL_DELIM, NULL }, /* Er */
+       { ARGSFL_DELIM, NULL }, /* Ev */
+       { ARGSFL_NONE, args_Ex }, /* Ex */
+       { ARGSFL_DELIM, NULL }, /* Fa */
+       { ARGSFL_NONE, NULL }, /* Fd */
+       { ARGSFL_DELIM, NULL }, /* Fl */
+       { ARGSFL_DELIM, NULL }, /* Fn */
+       { ARGSFL_DELIM, NULL }, /* Ft */
+       { ARGSFL_DELIM, NULL }, /* Ic */
+       { ARGSFL_DELIM, NULL }, /* In */
+       { ARGSFL_DELIM, NULL }, /* Li */
+       { ARGSFL_NONE, NULL }, /* Nd */
+       { ARGSFL_DELIM, NULL }, /* Nm */
+       { ARGSFL_DELIM, NULL }, /* Op */
+       { ARGSFL_DELIM, NULL }, /* Ot */
+       { ARGSFL_DELIM, NULL }, /* Pa */
+       { ARGSFL_NONE, args_Ex }, /* Rv */
+       { ARGSFL_DELIM, NULL }, /* St */
+       { ARGSFL_DELIM, NULL }, /* Va */
+       { ARGSFL_DELIM, NULL }, /* Vt */
+       { ARGSFL_DELIM, NULL }, /* Xr */
+       { ARGSFL_NONE, NULL }, /* %A */
+       { ARGSFL_NONE, NULL }, /* %B */
+       { ARGSFL_NONE, NULL }, /* %D */
+       { ARGSFL_NONE, NULL }, /* %I */
+       { ARGSFL_NONE, NULL }, /* %J */
+       { ARGSFL_NONE, NULL }, /* %N */
+       { ARGSFL_NONE, NULL }, /* %O */
+       { ARGSFL_NONE, NULL }, /* %P */
+       { ARGSFL_NONE, NULL }, /* %R */
+       { ARGSFL_NONE, NULL }, /* %T */
+       { ARGSFL_NONE, NULL }, /* %V */
+       { ARGSFL_DELIM, NULL }, /* Ac */
+       { ARGSFL_NONE, NULL }, /* Ao */
+       { ARGSFL_DELIM, NULL }, /* Aq */
+       { ARGSFL_DELIM, NULL }, /* At */
+       { ARGSFL_DELIM, NULL }, /* Bc */
+       { ARGSFL_NONE, args_Bf }, /* Bf */
+       { ARGSFL_NONE, NULL }, /* Bo */
+       { ARGSFL_DELIM, NULL }, /* Bq */
+       { ARGSFL_DELIM, NULL }, /* Bsx */
+       { ARGSFL_DELIM, NULL }, /* Bx */
+       { ARGSFL_NONE, NULL }, /* Db */
+       { ARGSFL_DELIM, NULL }, /* Dc */
+       { ARGSFL_NONE, NULL }, /* Do */
+       { ARGSFL_DELIM, NULL }, /* Dq */
+       { ARGSFL_DELIM, NULL }, /* Ec */
+       { ARGSFL_NONE, NULL }, /* Ef */
+       { ARGSFL_DELIM, NULL }, /* Em */
+       { ARGSFL_NONE, NULL }, /* Eo */
+       { ARGSFL_DELIM, NULL }, /* Fx */
+       { ARGSFL_DELIM, NULL }, /* Ms */
+       { ARGSFL_DELIM, NULL }, /* No */
+       { ARGSFL_DELIM, NULL }, /* Ns */
+       { ARGSFL_DELIM, NULL }, /* Nx */
+       { ARGSFL_DELIM, NULL }, /* Ox */
+       { ARGSFL_DELIM, NULL }, /* Pc */
+       { ARGSFL_DELIM, NULL }, /* Pf */
+       { ARGSFL_NONE, NULL }, /* Po */
+       { ARGSFL_DELIM, NULL }, /* Pq */
+       { ARGSFL_DELIM, NULL }, /* Qc */
+       { ARGSFL_DELIM, NULL }, /* Ql */
+       { ARGSFL_NONE, NULL }, /* Qo */
+       { ARGSFL_DELIM, NULL }, /* Qq */
+       { ARGSFL_NONE, NULL }, /* Re */
+       { ARGSFL_NONE, NULL }, /* Rs */
+       { ARGSFL_DELIM, NULL }, /* Sc */
+       { ARGSFL_NONE, NULL }, /* So */
+       { ARGSFL_DELIM, NULL }, /* Sq */
+       { ARGSFL_NONE, NULL }, /* Sm */
+       { ARGSFL_DELIM, NULL }, /* Sx */
+       { ARGSFL_DELIM, NULL }, /* Sy */
+       { ARGSFL_DELIM, NULL }, /* Tn */
+       { ARGSFL_DELIM, NULL }, /* Ux */
+       { ARGSFL_DELIM, NULL }, /* Xc */
+       { ARGSFL_NONE, NULL }, /* Xo */
+       { ARGSFL_NONE, NULL }, /* Fo */
+       { ARGSFL_DELIM, NULL }, /* Fc */
+       { ARGSFL_NONE, NULL }, /* Oo */
+       { ARGSFL_DELIM, NULL }, /* Oc */
+       { ARGSFL_NONE, args_Bk }, /* Bk */
+       { ARGSFL_NONE, NULL }, /* Ek */
+       { ARGSFL_NONE, NULL }, /* Bt */
+       { ARGSFL_NONE, NULL }, /* Hf */
+       { ARGSFL_DELIM, NULL }, /* Fr */
+       { ARGSFL_NONE, NULL }, /* Ud */
+       { ARGSFL_DELIM, NULL }, /* Lb */
+       { ARGSFL_NONE, NULL }, /* Lp */
+       { ARGSFL_DELIM, NULL }, /* Lk */
+       { ARGSFL_DELIM, NULL }, /* Mt */
+       { ARGSFL_DELIM, NULL }, /* Brq */
+       { ARGSFL_NONE, NULL }, /* Bro */
+       { ARGSFL_DELIM, NULL }, /* Brc */
+       { ARGSFL_NONE, NULL }, /* %C */
+       { ARGSFL_NONE, NULL }, /* Es */
+       { ARGSFL_DELIM, NULL }, /* En */
+       { ARGSFL_DELIM, NULL }, /* Dx */
+       { ARGSFL_NONE, NULL }, /* %Q */
+       { ARGSFL_NONE, NULL }, /* %U */
+       { ARGSFL_NONE, NULL }, /* Ta */
 };
 
 
 /*
- * Parse an argument from line text.  This comes in the form of -key
- * [value0...], which may either have a single mandatory value, at least
- * one mandatory value, an optional single value, or no value.
+ * Parse flags and their arguments from the input line.
+ * These come in the form -flag [argument ...].
+ * Some flags take no argument, some one, some multiple.
  */
-enum margverr
-mdoc_argv(struct mdoc *m, int line, enum mdoct tok,
-               struct mdoc_arg **v, int *pos, char *buf)
+void
+mdoc_argv(struct roff_man *mdoc, int line, enum roff_tok tok,
+       struct mdoc_arg **reta, int *pos, char *buf)
 {
-       char             *p, sv;
-       struct mdoc_argv tmp;
-       struct mdoc_arg  *arg;
+       struct mdoc_argv          tmpv;
+       struct mdoc_argv        **retv;
+       const enum mdocargt      *argtable;
+       char                     *argname;
+       int                       ipos, retc;
+       char                      savechar;
 
-       if (0 == buf[*pos])
-               return(ARGV_EOLN);
+       *reta = NULL;
 
-       assert(' ' != buf[*pos]);
+       /* Which flags does this macro support? */
+
+       assert(tok >= MDOC_Dd && tok < MDOC_MAX);
+       argtable = mdocargs[tok - MDOC_Dd].argvs;
+       if (argtable == NULL)
+               return;
 
-       /* Parse through to the first unescaped space. */
+       /* Loop over the flags on the input line. */
 
-       p = &buf[++(*pos)];
+       ipos = *pos;
+       while (buf[ipos] == '-') {
 
-       assert(*pos > 0);
+               /* Seek to the first unescaped space. */
 
-       /* LINTED */
-       while (buf[*pos]) {
-               if (' ' == buf[*pos])
-                       if ('\\' != buf[*pos - 1])
+               for (argname = buf + ++ipos; buf[ipos] != '\0'; ipos++)
+                       if (buf[ipos] == ' ' && buf[ipos - 1] != '\\')
                                break;
-               (*pos)++;
-       }
 
-       /* XXX - save zeroed byte, if not an argument. */
+               /*
+                * We want to nil-terminate the word to look it up.
+                * But we may not have a flag, in which case we need
+                * to restore the line as-is.  So keep around the
+                * stray byte, which we'll reset upon exiting.
+                */
 
-       sv = 0;
-       if (buf[*pos]) {
-               sv = buf[*pos];
-               buf[(*pos)++] = 0;
-       }
+               if ((savechar = buf[ipos]) != '\0')
+                       buf[ipos++] = '\0';
 
-       (void)memset(&tmp, 0, sizeof(struct mdoc_argv));
-       tmp.line = line;
-       tmp.pos = *pos;
+               /*
+                * Now look up the word as a flag.  Use temporary
+                * storage that we'll copy into the node's flags.
+                */
 
-       /* See if our token accepts the argument. */
+               while ((tmpv.arg = *argtable++) != MDOC_ARG_MAX)
+                       if ( ! strcmp(argname, mdoc_argnames[tmpv.arg]))
+                               break;
 
-       if (MDOC_ARG_MAX == (tmp.arg = argv_a2arg(tok, p))) {
-               /* XXX - restore saved zeroed byte. */
-               if (sv)
-                       buf[*pos - 1] = sv;
-               return(ARGV_WORD);
-       }
+               /* If it isn't a flag, restore the saved byte. */
 
-       while (buf[*pos] && ' ' == buf[*pos])
-               (*pos)++;
+               if (tmpv.arg == MDOC_ARG_MAX) {
+                       if (savechar != '\0')
+                               buf[ipos - 1] = savechar;
+                       break;
+               }
 
-       if ( ! argv(m, line, &tmp, pos, buf))
-               return(ARGV_ERROR);
+               /* Read to the next word (the first argument). */
 
-       if (NULL == (arg = *v))
-               arg = *v = mandoc_calloc(1, sizeof(struct mdoc_arg));
+               while (buf[ipos] == ' ')
+                       ipos++;
 
-       arg->argc++;
-       arg->argv = mandoc_realloc
-               (arg->argv, arg->argc * sizeof(struct mdoc_argv));
+               /* Parse the arguments of the flag. */
 
-       (void)memcpy(&arg->argv[(int)arg->argc - 1], 
-                       &tmp, sizeof(struct mdoc_argv));
+               tmpv.line  = line;
+               tmpv.pos   = *pos;
+               tmpv.sz    = 0;
+               tmpv.value = NULL;
 
-       return(ARGV_ARG);
-}
+               switch (argvflags[tmpv.arg]) {
+               case ARGV_SINGLE:
+                       argv_single(mdoc, line, &tmpv, &ipos, buf);
+                       break;
+               case ARGV_MULTI:
+                       argv_multi(mdoc, line, &tmpv, &ipos, buf);
+                       break;
+               case ARGV_NONE:
+                       break;
+               }
+
+               /* Append to the return values. */
 
+               if (*reta == NULL)
+                       *reta = mandoc_calloc(1, sizeof(**reta));
+
+               retc = ++(*reta)->argc;
+               retv = &(*reta)->argv;
+               *retv = mandoc_reallocarray(*retv, retc, sizeof(**retv));
+               memcpy(*retv + retc - 1, &tmpv, sizeof(**retv));
+
+               /* Prepare for parsing the next flag. */
+
+               *pos = ipos;
+               argtable = mdocargs[tok - MDOC_Dd].argvs;
+       }
+}
 
 void
 mdoc_argv_free(struct mdoc_arg *p)
@@ -301,21 +387,22 @@ mdoc_argv_free(struct mdoc_arg *p)
        assert(p->argc);
 
        for (i = (int)p->argc - 1; i >= 0; i--)
-               mdoc_argn_free(p, i);
+               argn_free(p, i);
 
        free(p->argv);
        free(p);
 }
 
-
-void
-mdoc_argn_free(struct mdoc_arg *p, int iarg)
+static void
+argn_free(struct mdoc_arg *p, int iarg)
 {
-       struct mdoc_argv *arg = &p->argv[iarg];
+       struct mdoc_argv *arg;
        int               j;
 
+       arg = &p->argv[iarg];
+
        if (arg->sz && arg->value) {
-               for (j = (int)arg->sz - 1; j >= 0; j--) 
+               for (j = (int)arg->sz - 1; j >= 0; j--)
                        free(arg->value[j]);
                free(arg->value);
        }
@@ -324,441 +411,272 @@ mdoc_argn_free(struct mdoc_arg *p, int iarg)
                p->argv[iarg] = p->argv[iarg+1];
 }
 
-
 enum margserr
-mdoc_zargs(struct mdoc *m, int line, int *pos, 
-               char *buf, int flags, char **v)
+mdoc_args(struct roff_man *mdoc, int line, int *pos,
+       char *buf, enum roff_tok tok, char **v)
 {
+       struct roff_node *n;
+       enum argsflag     fl;
 
-       return(args(m, line, pos, buf, flags, v));
-}
-
+       fl = tok == TOKEN_NONE ? ARGSFL_NONE : mdocargs[tok - MDOC_Dd].flags;
 
-enum margserr
-mdoc_args(struct mdoc *m, int line, int *pos, 
-               char *buf, enum mdoct tok, char **v)
-{
-       int               fl, c, i;
-       struct mdoc_node *n;
-
-       fl = mdoc_argflags[tok];
-
-       if (MDOC_It != tok)
-               return(args(m, line, pos, buf, fl, v));
-
-       /* 
-        * The `It' macro is a special case, as it acquires parameters from its
-        * parent `Bl' context, specifically, we're concerned with -column.
+       /*
+        * We know that we're in an `It', so it's reasonable to expect
+        * us to be sitting in a `Bl'.  Someday this may not be the case
+        * (if we allow random `It's sitting out there), so provide a
+        * safe fall-back into the default behaviour.
         */
 
-       for (n = m->last; n; n = n->parent)
-               if (MDOC_BLOCK == n->type && MDOC_Bl == n->tok)
+       if (tok == MDOC_It) {
+               for (n = mdoc->last; n != NULL; n = n->parent) {
+                       if (n->tok != MDOC_Bl)
+                               continue;
+                       if (n->norm->Bl.type == LIST_column)
+                               fl = ARGSFL_TABSEP;
                        break;
-
-       assert(n);
-       c = (int)(n->args ? n->args->argc : 0);
-       assert(c > 0);
-
-       /* LINTED */
-       for (i = 0; i < c; i++) {
-               if (MDOC_Column != n->args->argv[i].arg) 
-                       continue;
-               fl |= ARGS_TABSEP;
-               fl &= ~ARGS_DELIM;
-               break;
+               }
        }
 
-       return(args(m, line, pos, buf, fl, v));
+       return args(mdoc, line, pos, buf, fl, v);
 }
 
-
 static enum margserr
-args(struct mdoc *m, int line, int *pos, 
-               char *buf, int fl, char **v)
+args(struct roff_man *mdoc, int line, int *pos,
+               char *buf, enum argsflag fl, char **v)
 {
-       int               i;
-       char             *p, *pp;
-       enum margserr     rc;
-
-       /*
-        * Parse out the terms (like `val' in `.Xx -arg val' or simply
-        * `.Xx val'), which can have all sorts of properties:
-        *
-        *   ARGS_DELIM: use special handling if encountering trailing
-        *   delimiters in the form of [[::delim::][ ]+]+.
-        *
-        *   ARGS_NOWARN: don't post warnings.  This is only used when
-        *   re-parsing delimiters, as the warnings have already been
-        *   posted.
-        *
-        *   ARGS_TABSEP: use special handling for tab/`Ta' separated
-        *   phrases like in `Bl -column'.
-        */
-
-       assert(*pos);
-       assert(' ' != buf[*pos]);
-
-       if (0 == buf[*pos])
-               return(ARGS_EOLN);
-
-       /* 
-        * If the first character is a delimiter and we're to look for
-        * delimited strings, then pass down the buffer seeing if it
-        * follows the pattern of [[::delim::][ ]+]+.
-        */
-
-       if ((fl & ARGS_DELIM) && mdoc_iscdelim(buf[*pos]) > 1) {
-               for (i = *pos; buf[i]; ) {
-                       if ( mdoc_iscdelim(buf[i]) < 2)
-                               break;
-                       i++;
-                       if (0 == buf[i] || ' ' != buf[i])
-                               break;
-                       i++;
-                       while (buf[i] && ' ' == buf[i])
-                               i++;
-               }
-
-               if (0 == buf[i]) {
-                       *v = &buf[*pos];
-                       if (' ' != buf[i - 1])
-                               return(ARGS_PUNCT);
-                       if (ARGS_NOWARN & fl)
-                               return(ARGS_PUNCT);
-                       if ( ! mdoc_pwarn(m, line, *pos, ETAILWS))
-                               return(ARGS_ERROR);
-                       return(ARGS_PUNCT);
+       char            *p;
+       char            *v_local;
+       int              pairs;
+
+       if (buf[*pos] == '\0') {
+               if (mdoc->flags & MDOC_PHRASELIT &&
+                   ! (mdoc->flags & MDOC_PHRASE)) {
+                       mandoc_msg(MANDOCERR_ARG_QUOTE, line, *pos, NULL);
+                       mdoc->flags &= ~MDOC_PHRASELIT;
                }
+               mdoc->flags &= ~MDOC_PHRASEQL;
+               return ARGS_EOLN;
        }
 
-       *v = &buf[*pos];
+       if (v == NULL)
+               v = &v_local;
+       *v = buf + *pos;
+
+       if (fl == ARGSFL_DELIM && args_checkpunct(buf, *pos))
+               return ARGS_PUNCT;
 
        /*
-        * First handle TABSEP items, restricted to `Bl -column'.  This
-        * ignores conventional token parsing and instead uses tabs or
-        * `Ta' macros to separate phrases.  Phrases are parsed again
-        * for arguments at a later phase.
+        * Tabs in `It' lines in `Bl -column' can't be escaped.
+        * Phrases are reparsed for `Ta' and other macros later.
         */
 
-       if (ARGS_TABSEP & fl) {
-               rc = ARGS_PHRASE;
-               /* Scan ahead to tab (can't be escaped). */
-               p = strchr(*v, '\t');
-
-               /* Scan ahead to unescaped `Ta'. */
-               for (pp = *v; ; pp++) {
-                       if (NULL == (pp = strstr(pp, "Ta")))
-                               break;
-                       if (pp > *v && ' ' != *(pp - 1))
-                               continue;
-                       if (' ' == *(pp + 2) || 0 == *(pp + 2))
-                               break;
-               }
-
-               /* 
-                * Adjust new-buffer position to be beyond delimiter
-                * mark (e.g., Ta -> end + 2).
-                */
-               if (p && pp) {
-                       *pos += pp < p ? 2 : 1;
-                       p = pp < p ? pp : p;
-               } else if (p && ! pp) {
-                       *pos += 1;
-               } else if (pp && ! p) {
-                       p = pp;
-                       *pos += 2;
-               } else
-                       p = strchr(*v, 0);
-
-               /* Whitespace check for eoln case... */
-               if (0 == *p && ' ' == *(p - 1) && ! (ARGS_NOWARN & fl))
-                       if ( ! mdoc_pwarn(m, line, *pos, ETAILWS))
-                               return(ARGS_ERROR);
-
-               *pos += (int)(p - *v);
-
-               /* Strip delimiter's preceding whitespace. */
-               pp = p - 1;
-               while (pp > *v && ' ' == *pp) {
-                       if (pp > *v && '\\' == *(pp - 1))
-                               break;
-                       pp--;
+       if (fl == ARGSFL_TABSEP) {
+               if ((p = strchr(*v, '\t')) != NULL) {
+
+                       /*
+                        * Words right before and right after
+                        * tab characters are not parsed,
+                        * unless there is a blank in between.
+                        */
+
+                       if (p > buf && p[-1] != ' ')
+                               mdoc->flags |= MDOC_PHRASEQL;
+                       if (p[1] != ' ')
+                               mdoc->flags |= MDOC_PHRASEQN;
+
+                       /*
+                        * One or more blanks after a tab cause
+                        * one leading blank in the next column.
+                        * So skip all but one of them.
+                        */
+
+                       *pos += (int)(p - *v) + 1;
+                       while (buf[*pos] == ' ' && buf[*pos + 1] == ' ')
+                               (*pos)++;
+
+                       /*
+                        * A tab at the end of an input line
+                        * switches to the next column.
+                        */
+
+                       if (buf[*pos] == '\0' || buf[*pos + 1] == '\0')
+                               mdoc->flags |= MDOC_PHRASEQN;
+               } else {
+                       p = strchr(*v, '\0');
+                       if (p[-1] == ' ')
+                               mandoc_msg(MANDOCERR_SPACE_EOL,
+                                   line, *pos, NULL);
+                       *pos += (int)(p - *v);
                }
-               *(pp + 1) = 0;
 
-               /* Strip delimiter's proceeding whitespace. */
-               for (pp = &buf[*pos]; ' ' == *pp; pp++, (*pos)++)
-                       /* Skip ahead. */ ;
+               /* Skip any trailing blank characters. */
+               while (p > *v && p[-1] == ' ' &&
+                   (p - 1 == *v || p[-2] != '\\'))
+                       p--;
+               *p = '\0';
 
-               return(rc);
-       } 
+               return ARGS_PHRASE;
+       }
 
-       /* 
+       /*
         * Process a quoted literal.  A quote begins with a double-quote
         * and ends with a double-quote NOT preceded by a double-quote.
+        * NUL-terminate the literal in place.
+        * Collapse pairs of quotes inside quoted literals.
         * Whitespace is NOT involved in literal termination.
         */
 
-       if ('\"' == buf[*pos]) {
-               *v = &buf[++(*pos)];
-
+       if (mdoc->flags & MDOC_PHRASELIT ||
+           (mdoc->flags & MDOC_PHRASE && buf[*pos] == '\"')) {
+               if ((mdoc->flags & MDOC_PHRASELIT) == 0) {
+                       *v = &buf[++(*pos)];
+                       mdoc->flags |= MDOC_PHRASELIT;
+               }
+               pairs = 0;
                for ( ; buf[*pos]; (*pos)++) {
+                       /* Move following text left after quoted quotes. */
+                       if (pairs)
+                               buf[*pos - pairs] = buf[*pos];
                        if ('\"' != buf[*pos])
                                continue;
+                       /* Unquoted quotes end quoted args. */
                        if ('\"' != buf[*pos + 1])
                                break;
+                       /* Quoted quotes collapse. */
+                       pairs++;
                        (*pos)++;
                }
-
-               if (0 == buf[*pos]) {
-                       if (ARGS_NOWARN & fl)
-                               return(ARGS_QWORD);
-                       if ( ! mdoc_pwarn(m, line, *pos, EQUOTTERM))
-                               return(ARGS_ERROR);
-                       return(ARGS_QWORD);
+               if (pairs)
+                       buf[*pos - pairs] = '\0';
+
+               if (buf[*pos] == '\0') {
+                       if ( ! (mdoc->flags & MDOC_PHRASE))
+                               mandoc_msg(MANDOCERR_ARG_QUOTE,
+                                   line, *pos, NULL);
+                       return ARGS_WORD;
                }
 
-               buf[(*pos)++] = 0;
+               mdoc->flags &= ~MDOC_PHRASELIT;
+               buf[(*pos)++] = '\0';
 
-               if (0 == buf[*pos])
-                       return(ARGS_QWORD);
+               if ('\0' == buf[*pos])
+                       return ARGS_WORD;
 
                while (' ' == buf[*pos])
                        (*pos)++;
 
-               if (0 == buf[*pos] && ! (ARGS_NOWARN & fl))
-                       if ( ! mdoc_pwarn(m, line, *pos, ETAILWS))
-                               return(ARGS_ERROR);
+               if ('\0' == buf[*pos])
+                       mandoc_msg(MANDOCERR_SPACE_EOL, line, *pos, NULL);
 
-               return(ARGS_QWORD);
+               return ARGS_WORD;
        }
 
-       /* 
-        * A non-quoted term progresses until either the end of line or
-        * a non-escaped whitespace.
+       p = &buf[*pos];
+       *v = roff_getarg(mdoc->roff, &p, line, pos);
+       if (v == &v_local)
+               free(*v);
+
+       /*
+        * After parsing the last word in this phrase,
+        * tell lookup() whether or not to interpret it.
         */
 
-       for ( ; buf[*pos]; (*pos)++)
-               if (' ' == buf[*pos] && '\\' != buf[*pos - 1])
-                       break;
+       if (*p == '\0' && mdoc->flags & MDOC_PHRASEQL) {
+               mdoc->flags &= ~MDOC_PHRASEQL;
+               mdoc->flags |= MDOC_PHRASEQF;
+       }
+       return ARGS_ALLOC;
+}
 
-       if (0 == buf[*pos])
-               return(ARGS_WORD);
+/*
+ * Check if the string consists only of space-separated closing
+ * delimiters.  This is a bit of a dance: the first must be a close
+ * delimiter, but it may be followed by middle delimiters.  Arbitrary
+ * whitespace may separate these tokens.
+ */
+static int
+args_checkpunct(const char *buf, int i)
+{
+       int              j;
+       char             dbuf[DELIMSZ];
+       enum mdelim      d;
 
-       buf[(*pos)++] = 0;
+       /* First token must be a close-delimiter. */
 
-       while (' ' == buf[*pos])
-               (*pos)++;
+       for (j = 0; buf[i] && ' ' != buf[i] && j < DELIMSZ; j++, i++)
+               dbuf[j] = buf[i];
 
-       if (0 == buf[*pos] && ! (ARGS_NOWARN & fl))
-               if ( ! mdoc_pwarn(m, line, *pos, ETAILWS))
-                       return(ARGS_ERROR);
+       if (DELIMSZ == j)
+               return 0;
 
-       return(ARGS_WORD);
-}
+       dbuf[j] = '\0';
+       if (DELIM_CLOSE != mdoc_isdelim(dbuf))
+               return 0;
 
+       while (' ' == buf[i])
+               i++;
 
-static int
-argv_a2arg(enum mdoct tok, const char *p)
-{
+       /* Remaining must NOT be open/none. */
 
-       /*
-        * Parse an argument identifier from its text.  XXX - this
-        * should really be table-driven to clarify the code.
-        *
-        * If you add an argument to the list, make sure that you
-        * register it here with its one or more macros!
-        */
+       while (buf[i]) {
+               j = 0;
+               while (buf[i] && ' ' != buf[i] && j < DELIMSZ)
+                       dbuf[j++] = buf[i++];
+
+               if (DELIMSZ == j)
+                       return 0;
 
-       switch (tok) {
-       case (MDOC_An):
-               if (0 == strcmp(p, "split"))
-                       return(MDOC_Split);
-               else if (0 == strcmp(p, "nosplit"))
-                       return(MDOC_Nosplit);
-               break;
-
-       case (MDOC_Bd):
-               if (0 == strcmp(p, "ragged"))
-                       return(MDOC_Ragged);
-               else if (0 == strcmp(p, "unfilled"))
-                       return(MDOC_Unfilled);
-               else if (0 == strcmp(p, "filled"))
-                       return(MDOC_Filled);
-               else if (0 == strcmp(p, "literal"))
-                       return(MDOC_Literal);
-               else if (0 == strcmp(p, "file"))
-                       return(MDOC_File);
-               else if (0 == strcmp(p, "offset"))
-                       return(MDOC_Offset);
-               else if (0 == strcmp(p, "compact"))
-                       return(MDOC_Compact);
-               else if (0 == strcmp(p, "centered"))
-                       return(MDOC_Centred);
-               break;
-
-       case (MDOC_Bf):
-               if (0 == strcmp(p, "emphasis"))
-                       return(MDOC_Emphasis);
-               else if (0 == strcmp(p, "literal"))
-                       return(MDOC_Literal);
-               else if (0 == strcmp(p, "symbolic"))
-                       return(MDOC_Symbolic);
-               break;
-
-       case (MDOC_Bk):
-               if (0 == strcmp(p, "words"))
-                       return(MDOC_Words);
-               break;
-
-       case (MDOC_Bl):
-               if (0 == strcmp(p, "bullet"))
-                       return(MDOC_Bullet);
-               else if (0 == strcmp(p, "dash"))
-                       return(MDOC_Dash);
-               else if (0 == strcmp(p, "hyphen"))
-                       return(MDOC_Hyphen);
-               else if (0 == strcmp(p, "item"))
-                       return(MDOC_Item);
-               else if (0 == strcmp(p, "enum"))
-                       return(MDOC_Enum);
-               else if (0 == strcmp(p, "tag"))
-                       return(MDOC_Tag);
-               else if (0 == strcmp(p, "diag"))
-                       return(MDOC_Diag);
-               else if (0 == strcmp(p, "hang"))
-                       return(MDOC_Hang);
-               else if (0 == strcmp(p, "ohang"))
-                       return(MDOC_Ohang);
-               else if (0 == strcmp(p, "inset"))
-                       return(MDOC_Inset);
-               else if (0 == strcmp(p, "column"))
-                       return(MDOC_Column);
-               else if (0 == strcmp(p, "width"))
-                       return(MDOC_Width);
-               else if (0 == strcmp(p, "offset"))
-                       return(MDOC_Offset);
-               else if (0 == strcmp(p, "compact"))
-                       return(MDOC_Compact);
-               else if (0 == strcmp(p, "nested"))
-                       return(MDOC_Nested);
-               break;
-       
-       case (MDOC_Rv):
-               /* FALLTHROUGH */
-       case (MDOC_Ex):
-               if (0 == strcmp(p, "std"))
-                       return(MDOC_Std);
-               break;
-       default:
-               break;
+               dbuf[j] = '\0';
+               d = mdoc_isdelim(dbuf);
+               if (DELIM_NONE == d || DELIM_OPEN == d)
+                       return 0;
+
+               while (' ' == buf[i])
+                       i++;
        }
 
-       return(MDOC_ARG_MAX);
+       return '\0' == buf[i];
 }
 
-
-static int
-argv_multi(struct mdoc *m, int line, 
+static void
+argv_multi(struct roff_man *mdoc, int line,
                struct mdoc_argv *v, int *pos, char *buf)
 {
-       int              c;
+       enum margserr    ac;
        char            *p;
 
        for (v->sz = 0; ; v->sz++) {
-               if ('-' == buf[*pos])
+               if (buf[*pos] == '-')
                        break;
-               c = args(m, line, pos, buf, 0, &p);
-               if (ARGS_ERROR == c)
-                       return(0);
-               else if (ARGS_EOLN == c)
+               ac = args(mdoc, line, pos, buf, ARGSFL_NONE, &p);
+               if (ac == ARGS_EOLN)
                        break;
 
-               if (0 == v->sz % MULTI_STEP)
-                       v->value = mandoc_realloc(v->value, 
-                               (v->sz + MULTI_STEP) * sizeof(char *));
+               if (v->sz % MULTI_STEP == 0)
+                       v->value = mandoc_reallocarray(v->value,
+                           v->sz + MULTI_STEP, sizeof(char *));
 
-               v->value[(int)v->sz] = mandoc_strdup(p);
+               if (ac != ARGS_ALLOC)
+                       p = mandoc_strdup(p);
+               v->value[(int)v->sz] = p;
        }
-
-       return(1);
 }
 
-
-static int
-argv_opt_single(struct mdoc *m, int line, 
+static void
+argv_single(struct roff_man *mdoc, int line,
                struct mdoc_argv *v, int *pos, char *buf)
 {
-       int              c;
+       enum margserr    ac;
        char            *p;
 
-       if ('-' == buf[*pos])
-               return(1);
-
-       c = args(m, line, pos, buf, 0, &p);
-       if (ARGS_ERROR == c)
-               return(0);
-       if (ARGS_EOLN == c)
-               return(1);
-
-       v->sz = 1;
-       v->value = mandoc_malloc(sizeof(char *));
-       v->value[0] = mandoc_strdup(p);
-
-       return(1);
-}
-
-
-/*
- * Parse a single, mandatory value from the stream.
- */
-static int
-argv_single(struct mdoc *m, int line, 
-               struct mdoc_argv *v, int *pos, char *buf)
-{
-       int              c, ppos;
-       char            *p;
-
-       ppos = *pos;
+       ac = args(mdoc, line, pos, buf, ARGSFL_NONE, &p);
+       if (ac == ARGS_EOLN)
+               return;
 
-       c = args(m, line, pos, buf, 0, &p);
-       if (ARGS_ERROR == c)
-               return(0);
-       if (ARGS_EOLN == c)
-               return(mdoc_perr(m, line, ppos, EARGVAL));
+       if (ac != ARGS_ALLOC)
+               p = mandoc_strdup(p);
 
        v->sz = 1;
        v->value = mandoc_malloc(sizeof(char *));
-       v->value[0] = mandoc_strdup(p);
-
-       return(1);
-}
-
-
-/*
- * Determine rules for parsing arguments.  Arguments can either accept
- * no parameters, an optional single parameter, one parameter, or
- * multiple parameters.
- */
-static int
-argv(struct mdoc *mdoc, int line, 
-               struct mdoc_argv *v, int *pos, char *buf)
-{
-
-       v->sz = 0;
-       v->value = NULL;
-
-       switch (mdoc_argvflags[v->arg]) {
-       case (ARGV_SINGLE):
-               return(argv_single(mdoc, line, v, pos, buf));
-       case (ARGV_MULTI):
-               return(argv_multi(mdoc, line, v, pos, buf));
-       case (ARGV_OPT_SINGLE):
-               return(argv_opt_single(mdoc, line, v, pos, buf));
-       default:
-               /* ARGV_NONE */
-               break;
-       }
-
-       return(1);
+       v->value[0] = p;
 }