]> git.cameronkatri.com Git - mandoc.git/blobdiff - roff.c
Major roff_getname() cleanup.
[mandoc.git] / roff.c
diff --git a/roff.c b/roff.c
index ca8d7f1f0a6672590e894a3fde078c6803cca6ab..2b01f5936ffd25b784b0967724251a4b23deff56 100644 (file)
--- a/roff.c
+++ b/roff.c
@@ -1,4 +1,4 @@
-/*     $Id: roff.c,v 1.204 2014/04/07 15:07:13 schwarze Exp $ */
+/*     $Id: roff.c,v 1.212 2014/06/29 22:14:10 schwarze Exp $ */
 /*
  * Copyright (c) 2010, 2011, 2012 Kristaps Dzonsons <kristaps@bsd.lv>
  * Copyright (c) 2010-2014 Ingo Schwarze <schwarze@openbsd.org>
@@ -137,7 +137,7 @@ struct      roffnode {
 
 #define        ROFF_ARGS        struct roff *r, /* parse ctx */ \
                         enum rofft tok, /* tok of macro */ \
-                        char **bufp, /* input buffer */ \
+                        char **bufp, /* input buffer */ \
                         size_t *szp, /* size of input buffer */ \
                         int ln, /* parse line */ \
                         int ppos, /* original pos in buffer */ \
@@ -187,13 +187,13 @@ static    int              roff_evalstrcond(const char *, int *);
 static void             roff_free1(struct roff *);
 static void             roff_freereg(struct roffreg *);
 static void             roff_freestr(struct roffkv *);
-static char            *roff_getname(struct roff *, char **, int, int);
+static size_t           roff_getname(struct roff *, char **, int, int);
 static int              roff_getnum(const char *, int *, int *);
 static int              roff_getop(const char *, int *, char *);
 static int              roff_getregn(const struct roff *,
                                const char *, size_t);
 static int              roff_getregro(const char *name);
-static const char      *roff_getstrn(const struct roff *, 
+static const char      *roff_getstrn(const struct roff *,
                                const char *, size_t);
 static enum rofferr     roff_it(ROFF_ARGS);
 static enum rofferr     roff_line_ignore(ROFF_ARGS);
@@ -202,13 +202,13 @@ static    void             roff_openeqn(struct roff *, const char *,
                                int, int, const char *);
 static enum rofft       roff_parse(struct roff *, const char *, int *);
 static enum rofferr     roff_parsetext(char **, size_t *, int, int *);
-static enum rofferr     roff_res(struct roff *, 
+static enum rofferr     roff_res(struct roff *,
                                char **, size_t *, int, int);
 static enum rofferr     roff_rm(ROFF_ARGS);
 static enum rofferr     roff_rr(ROFF_ARGS);
 static void             roff_setstr(struct roff *,
                                const char *, const char *, int);
-static void             roff_setstrn(struct roffkv **, const char *, 
+static void             roff_setstrn(struct roffkv **, const char *,
                                size_t, const char *, size_t, int);
 static enum rofferr     roff_so(ROFF_ARGS);
 static enum rofferr     roff_tr(ROFF_ARGS);
@@ -315,6 +315,7 @@ static      const struct predef predefs[PREDEFS_MAX] = {
 static int      roffit_lines;  /* number of lines to delay */
 static char    *roffit_macro;  /* nil-terminated macro line */
 
+
 static void
 roffhash_init(void)
 {
@@ -367,7 +368,6 @@ roffhash_find(const char *p, size_t s)
        return(ROFF_MAX);
 }
 
-
 /*
  * Pop the current node off of the stack of roff instructions currently
  * pending.
@@ -378,7 +378,7 @@ roffnode_pop(struct roff *r)
        struct roffnode *p;
 
        assert(r->last);
-       p = r->last; 
+       p = r->last;
 
        r->last = r->last->parent;
        free(p->name);
@@ -386,7 +386,6 @@ roffnode_pop(struct roff *r)
        free(p);
 }
 
-
 /*
  * Push a roff node onto the instruction stack.  This must later be
  * removed with roffnode_pop().
@@ -409,7 +408,6 @@ roffnode_push(struct roff *r, enum rofft tok, const char *name,
        r->last = p;
 }
 
-
 static void
 roff_free1(struct roff *r)
 {
@@ -459,7 +457,6 @@ roff_reset(struct roff *r)
        r->control = 0;
 }
 
-
 void
 roff_free(struct roff *r)
 {
@@ -468,7 +465,6 @@ roff_free(struct roff *r)
        free(r);
 }
 
-
 struct roff *
 roff_alloc(struct mparse *parse, int options)
 {
@@ -478,64 +474,83 @@ roff_alloc(struct mparse *parse, int options)
        r->parse = parse;
        r->options = options;
        r->rstackpos = -1;
-       
+
        roffhash_init();
 
        return(r);
 }
 
 /*
- * In the current line, expand user-defined strings ("\*")
- * and references to number registers ("\n").
- * Also check the syntax of other escape sequences.
+ * In the current line, expand escape sequences that tend to get
+ * used in numerical expressions and conditional requests.
+ * Also check the syntax of the remaining escape sequences.
  */
 static enum rofferr
 roff_res(struct roff *r, char **bufp, size_t *szp, int ln, int pos)
 {
-       char             ubuf[12]; /* buffer to print the number */
-       const char      *stesc; /* start of an escape sequence ('\\') */
+       char             ubuf[24]; /* buffer to print the number */
+       const char      *start; /* start of the string to process */
+       char            *stesc; /* start of an escape sequence ('\\') */
        const char      *stnam; /* start of the name, after "[(*" */
        const char      *cp;    /* end of the name, e.g. before ']' */
        const char      *res;   /* the string to be substituted */
        char            *nbuf;  /* new buffer to copy bufp to */
-       size_t           nsz;   /* size of the new buffer */
        size_t           maxl;  /* expected length of the escape name */
        size_t           naml;  /* actual length of the escape name */
        int              expand_count;  /* to avoid infinite loops */
+       int              npos;  /* position in numeric expression */
+       int              irc;   /* return code from roff_evalnum() */
+       char             term;  /* character terminating the escape */
 
        expand_count = 0;
+       start = *bufp + pos;
+       stesc = strchr(start, '\0') - 1;
+       while (stesc-- > start) {
 
-again:
-       cp = *bufp + pos;
-       while (NULL != (cp = strchr(cp, '\\'))) {
-               stesc = cp++;
+               /* Search backwards for the next backslash. */
 
-               /*
-                * The second character must be an asterisk or an n.
-                * If it isn't, skip it anyway:  It is escaped,
-                * so it can't start another escape sequence.
-                */
+               if ('\\' != *stesc)
+                       continue;
+
+               /* If it is escaped, skip it. */
 
-               if ('\0' == *cp)
-                       return(ROFF_CONT);
+               for (cp = stesc - 1; cp >= start; cp--)
+                       if ('\\' != *cp)
+                               break;
 
+               if (0 == (stesc - cp) % 2) {
+                       stesc = (char *)cp;
+                       continue;
+               }
+
+               /* Decide whether to expand or to check only. */
+
+               term = '\0';
+               cp = stesc + 1;
                switch (*cp) {
-               case ('*'):
+               case '*':
                        res = NULL;
                        break;
-               case ('n'):
+               case 'B':
+                       /* FALLTHROUGH */
+               case 'w':
+                       term = cp[1];
+                       /* FALLTHROUGH */
+               case 'n':
                        res = ubuf;
                        break;
                default:
-                       if (ESCAPE_ERROR != mandoc_escape(&cp, NULL, NULL))
-                               continue;
-                       mandoc_msg
-                               (MANDOCERR_BADESCAPE, r->parse, 
-                                ln, (int)(stesc - *bufp), NULL);
-                       return(ROFF_CONT);
+                       if (ESCAPE_ERROR == mandoc_escape(&cp, NULL, NULL))
+                               mandoc_msg(MANDOCERR_BADESCAPE, r->parse,
+                                   ln, (int)(stesc - *bufp), NULL);
+                       continue;
                }
 
-               cp++;
+               if (EXPAND_LIMIT < ++expand_count) {
+                       mandoc_msg(MANDOCERR_ROFFLOOP, r->parse,
+                           ln, (int)(stesc - *bufp), NULL);
+                       return(ROFF_IGN);
+               }
 
                /*
                 * The third character decides the length
@@ -543,20 +558,27 @@ again:
                 * Save a pointer to the name.
                 */
 
-               switch (*cp) {
-               case ('\0'):
-                       return(ROFF_CONT);
-               case ('('):
-                       cp++;
-                       maxl = 2;
-                       break;
-               case ('['):
-                       cp++;
+               if ('\0' == term) {
+                       switch (*++cp) {
+                       case '\0':
+                               maxl = 0;
+                               break;
+                       case '(':
+                               cp++;
+                               maxl = 2;
+                               break;
+                       case '[':
+                               cp++;
+                               term = ']';
+                               maxl = 0;
+                               break;
+                       default:
+                               maxl = 1;
+                               break;
+                       }
+               } else {
+                       cp += 2;
                        maxl = 0;
-                       break;
-               default:
-                       maxl = 1;
-                       break;
                }
                stnam = cp;
 
@@ -564,14 +586,14 @@ again:
 
                for (naml = 0; 0 == maxl || naml < maxl; naml++, cp++) {
                        if ('\0' == *cp) {
-                               mandoc_msg
-                                       (MANDOCERR_BADESCAPE, 
-                                        r->parse, ln, 
-                                        (int)(stesc - *bufp), NULL);
-                               return(ROFF_CONT);
+                               mandoc_msg(MANDOCERR_BADESCAPE, r->parse,
+                                   ln, (int)(stesc - *bufp), NULL);
+                               break;
                        }
-                       if (0 == maxl && ']' == *cp)
+                       if (0 == maxl && *cp == term) {
+                               cp++;
                                break;
+                       }
                }
 
                /*
@@ -579,41 +601,45 @@ again:
                 * undefined, resume searching for escapes.
                 */
 
-               if (NULL == res)
+               switch (stesc[1]) {
+               case '*':
                        res = roff_getstrn(r, stnam, naml);
-               else
-                       snprintf(ubuf, sizeof(ubuf), "%d",
+                       break;
+               case 'B':
+                       npos = 0;
+                       irc = roff_evalnum(stnam, &npos, NULL, 0);
+                       ubuf[0] = irc && stnam + npos + 1 == cp
+                           ? '1' : '0';
+                       ubuf[1] = '\0';
+                       break;
+               case 'n':
+                       (void)snprintf(ubuf, sizeof(ubuf), "%d",
                            roff_getregn(r, stnam, naml));
+                       break;
+               case 'w':
+                       (void)snprintf(ubuf, sizeof(ubuf), "%d",
+                           24 * (int)naml);
+                       break;
+               }
 
                if (NULL == res) {
-                       mandoc_msg
-                               (MANDOCERR_BADESCAPE, r->parse, 
-                                ln, (int)(stesc - *bufp), NULL);
+                       mandoc_msg(MANDOCERR_BADESCAPE, r->parse,
+                           ln, (int)(stesc - *bufp), NULL);
                        res = "";
                }
 
                /* Replace the escape sequence by the string. */
 
-               pos = stesc - *bufp;
-
-               nsz = *szp + strlen(res) + 1;
-               nbuf = mandoc_malloc(nsz);
+               *stesc = '\0';
+               *szp = mandoc_asprintf(&nbuf, "%s%s%s",
+                   *bufp, res, cp) + 1;
 
-               strlcpy(nbuf, *bufp, (size_t)(stesc - *bufp + 1));
-               strlcat(nbuf, res, nsz);
-               strlcat(nbuf, cp + (maxl ? 0 : 1), nsz);
+               /* Prepare for the next replacement. */
 
+               start = nbuf + pos;
+               stesc = nbuf + (stesc - *bufp) + strlen(res);
                free(*bufp);
-
                *bufp = nbuf;
-               *szp = nsz;
-
-               if (EXPAND_LIMIT >= ++expand_count)
-                       goto again;
-
-               /* Just leave the string unexpanded. */
-               mandoc_msg(MANDOCERR_ROFFLOOP, r->parse, ln, pos, NULL);
-               return(ROFF_IGN);
        }
        return(ROFF_CONT);
 }
@@ -675,7 +701,7 @@ roff_parsetext(char **bufp, size_t *szp, int pos, int *offs)
 }
 
 enum rofferr
-roff_parseln(struct roff *r, int ln, char **bufp, 
+roff_parseln(struct roff *r, int ln, char **bufp,
                size_t *szp, int pos, int *offs)
 {
        enum rofft       t;
@@ -706,8 +732,7 @@ roff_parseln(struct roff *r, int ln, char **bufp,
        if (r->last && ! ctl) {
                t = r->last->tok;
                assert(roffs[t].text);
-               e = (*roffs[t].text)
-                       (r, t, bufp, szp, ln, pos, pos, offs);
+               e = (*roffs[t].text)(r, t, bufp, szp, ln, pos, pos, offs);
                assert(ROFF_IGN == e || ROFF_CONT == e);
                if (ROFF_CONT != e)
                        return(e);
@@ -729,9 +754,8 @@ roff_parseln(struct roff *r, int ln, char **bufp,
        if (r->last) {
                t = r->last->tok;
                assert(roffs[t].sub);
-               return((*roffs[t].sub)
-                               (r, t, bufp, szp, 
-                                ln, ppos, pos, offs));
+               return((*roffs[t].sub)(r, t, bufp, szp,
+                   ln, ppos, pos, offs));
        }
 
        /*
@@ -744,29 +768,26 @@ roff_parseln(struct roff *r, int ln, char **bufp,
                return(ROFF_CONT);
 
        assert(roffs[t].proc);
-       return((*roffs[t].proc)
-                       (r, t, bufp, szp, 
-                        ln, ppos, pos, offs));
+       return((*roffs[t].proc)(r, t, bufp, szp, ln, ppos, pos, offs));
 }
 
-
 void
 roff_endparse(struct roff *r)
 {
 
        if (r->last)
                mandoc_msg(MANDOCERR_SCOPEEXIT, r->parse,
-                               r->last->line, r->last->col, NULL);
+                   r->last->line, r->last->col, NULL);
 
        if (r->eqn) {
-               mandoc_msg(MANDOCERR_SCOPEEXIT, r->parse, 
-                               r->eqn->eqn.ln, r->eqn->eqn.pos, NULL);
+               mandoc_msg(MANDOCERR_SCOPEEXIT, r->parse,
+                   r->eqn->eqn.ln, r->eqn->eqn.pos, NULL);
                eqn_end(&r->eqn);
        }
 
        if (r->tbl) {
-               mandoc_msg(MANDOCERR_SCOPEEXIT, r->parse, 
-                               r->tbl->line, r->tbl->pos, NULL);
+               mandoc_msg(MANDOCERR_SCOPEEXIT, r->parse,
+                   r->tbl->line, r->tbl->pos, NULL);
                tbl_end(&r->tbl);
        }
 }
@@ -782,8 +803,8 @@ roff_parse(struct roff *r, const char *buf, int *pos)
        size_t           maclen;
        enum rofft       t;
 
-       if ('\0' == buf[*pos] || '"' == buf[*pos] || 
-                       '\t' == buf[*pos] || ' ' == buf[*pos])
+       if ('\0' == buf[*pos] || '"' == buf[*pos] ||
+           '\t' == buf[*pos] || ' ' == buf[*pos])
                return(ROFF_MAX);
 
        /* We stop the macro parse at an escape, tab, space, or nil. */
@@ -802,7 +823,6 @@ roff_parse(struct roff *r, const char *buf, int *pos)
        return(t);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_cblock(ROFF_ARGS)
 {
@@ -818,18 +838,18 @@ roff_cblock(ROFF_ARGS)
        }
 
        switch (r->last->tok) {
-       case (ROFF_am):
+       case ROFF_am:
                /* FALLTHROUGH */
-       case (ROFF_ami):
+       case ROFF_ami:
                /* FALLTHROUGH */
-       case (ROFF_am1):
+       case ROFF_am1:
                /* FALLTHROUGH */
-       case (ROFF_de):
+       case ROFF_de:
                /* ROFF_de1 is remapped to ROFF_de in roff_block(). */
                /* FALLTHROUGH */
-       case (ROFF_dei):
+       case ROFF_dei:
                /* FALLTHROUGH */
-       case (ROFF_ig):
+       case ROFF_ig:
                break;
        default:
                mandoc_msg(MANDOCERR_NOSCOPE, r->parse, ln, ppos, NULL);
@@ -845,7 +865,6 @@ roff_cblock(ROFF_ARGS)
 
 }
 
-
 static void
 roffnode_cleanscope(struct roff *r)
 {
@@ -857,7 +876,6 @@ roffnode_cleanscope(struct roff *r)
        }
 }
 
-
 static void
 roff_ccond(struct roff *r, int ln, int ppos)
 {
@@ -868,11 +886,11 @@ roff_ccond(struct roff *r, int ln, int ppos)
        }
 
        switch (r->last->tok) {
-       case (ROFF_el):
+       case ROFF_el:
                /* FALLTHROUGH */
-       case (ROFF_ie):
+       case ROFF_ie:
                /* FALLTHROUGH */
-       case (ROFF_if):
+       case ROFF_if:
                break;
        default:
                mandoc_msg(MANDOCERR_NOSCOPE, r->parse, ln, ppos, NULL);
@@ -889,8 +907,6 @@ roff_ccond(struct roff *r, int ln, int ppos)
        return;
 }
 
-
-/* ARGSUSED */
 static enum rofferr
 roff_block(ROFF_ARGS)
 {
@@ -969,8 +985,6 @@ roff_block(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-
-/* ARGSUSED */
 static enum rofferr
 roff_block_sub(ROFF_ARGS)
 {
@@ -991,10 +1005,10 @@ roff_block_sub(ROFF_ARGS)
                        if ((*bufp)[i] != r->last->end[j])
                                break;
 
-               if ('\0' == r->last->end[j] && 
-                               ('\0' == (*bufp)[i] ||
-                                ' ' == (*bufp)[i] ||
-                                '\t' == (*bufp)[i])) {
+               if ('\0' == r->last->end[j] &&
+                   ('\0' == (*bufp)[i] ||
+                    ' '  == (*bufp)[i] ||
+                    '\t' == (*bufp)[i])) {
                        roffnode_pop(r);
                        roffnode_cleanscope(r);
 
@@ -1026,12 +1040,9 @@ roff_block_sub(ROFF_ARGS)
        }
 
        assert(roffs[t].proc);
-       return((*roffs[t].proc)(r, t, bufp, szp, 
-                               ln, ppos, pos, offs));
+       return((*roffs[t].proc)(r, t, bufp, szp, ln, ppos, pos, offs));
 }
 
-
-/* ARGSUSED */
 static enum rofferr
 roff_block_text(ROFF_ARGS)
 {
@@ -1042,8 +1053,6 @@ roff_block_text(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-
-/* ARGSUSED */
 static enum rofferr
 roff_cond_sub(ROFF_ARGS)
 {
@@ -1064,7 +1073,7 @@ roff_cond_sub(ROFF_ARGS)
            (rr || ROFFMAC_STRUCT & roffs[t].flags)) {
                assert(roffs[t].proc);
                return((*roffs[t].proc)(r, t, bufp, szp,
-                                       ln, ppos, pos, offs));
+                   ln, ppos, pos, offs));
        }
 
        /*
@@ -1088,7 +1097,6 @@ roff_cond_sub(ROFF_ARGS)
        return(rr ? ROFF_CONT : ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_cond_text(ROFF_ARGS)
 {
@@ -1118,7 +1126,10 @@ roff_cond_text(ROFF_ARGS)
 static int
 roff_getnum(const char *v, int *pos, int *res)
 {
-       int p, n;
+       int      myres, n, p;
+
+       if (NULL == res)
+               res = &myres;
 
        p = *pos;
        n = v[p] == '-';
@@ -1196,20 +1207,20 @@ roff_evalcond(const char *v, int *pos)
                wanttrue = 1;
 
        switch (v[*pos]) {
-       case ('n'):
+       case 'n':
                /* FALLTHROUGH */
-       case ('o'):
+       case 'o':
                (*pos)++;
                return(wanttrue);
-       case ('c'):
+       case 'c':
                /* FALLTHROUGH */
-       case ('d'):
+       case 'd':
                /* FALLTHROUGH */
-       case ('e'):
+       case 'e':
                /* FALLTHROUGH */
-       case ('r'):
+       case 'r':
                /* FALLTHROUGH */
-       case ('t'):
+       case 't':
                (*pos)++;
                return(!wanttrue);
        default:
@@ -1222,7 +1233,6 @@ roff_evalcond(const char *v, int *pos)
                return(roff_evalstrcond(v, pos) == wanttrue);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_line_ignore(ROFF_ARGS)
 {
@@ -1230,24 +1240,23 @@ roff_line_ignore(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_cond(ROFF_ARGS)
 {
 
        roffnode_push(r, tok, NULL, ln, ppos);
 
-       /* 
+       /*
         * An `.el' has no conditional body: it will consume the value
         * of the current rstack entry set in prior `ie' calls or
-        * defaults to DENY.  
+        * defaults to DENY.
         *
         * If we're not an `el', however, then evaluate the conditional.
         */
 
        r->last->rule = ROFF_el == tok ?
-               (r->rstackpos < 0 ? 0 : r->rstack[r->rstackpos--]) :
-               roff_evalcond(*bufp, &pos);
+           (r->rstackpos < 0 ? 0 : r->rstack[r->rstackpos--]) :
+           roff_evalcond(*bufp, &pos);
 
        /*
         * An if-else will put the NEGATION of the current evaluated
@@ -1256,8 +1265,8 @@ roff_cond(ROFF_ARGS)
 
        if (ROFF_ie == tok) {
                if (r->rstackpos == RSTACK_MAX - 1) {
-                       mandoc_msg(MANDOCERR_MEM, 
-                               r->parse, ln, ppos, NULL);
+                       mandoc_msg(MANDOCERR_MEM,
+                           r->parse, ln, ppos, NULL);
                        return(ROFF_ERR);
                }
                r->rstack[++r->rstackpos] = !r->last->rule;
@@ -1288,7 +1297,7 @@ roff_cond(ROFF_ARGS)
                r->last->endspan = -1;
                pos += 2;
                goto out;
-       } 
+       }
 
        /*
         * Anything else following the conditional causes
@@ -1306,34 +1315,34 @@ out:
        return(ROFF_RERUN);
 }
 
-
-/* ARGSUSED */
 static enum rofferr
 roff_ds(ROFF_ARGS)
 {
-       char            *name, *string;
+       char            *string;
+       const char      *name;
+       size_t           namesz;
 
        /*
-        * A symbol is named by the first word following the macro
-        * invocation up to a space.  Its value is anything after the
-        * name's trailing whitespace and optional double-quote.  Thus,
-        *
-        *  [.ds foo "bar  "     ]
-        *
-        * will have `bar  "     ' as its value.
+        * The first word is the name of the string.
+        * If it is empty or terminated by an escape sequence,
+        * abort the `ds' request without defining anything.
         */
 
-       string = *bufp + pos;
-       name = roff_getname(r, &string, ln, pos);
+       name = string = *bufp + pos;
        if ('\0' == *name)
                return(ROFF_IGN);
 
-       /* Read past initial double-quote. */
+       namesz = roff_getname(r, &string, ln, pos);
+       if ('\\' == name[namesz])
+               return(ROFF_IGN);
+
+       /* Read past the initial double-quote, if any. */
        if ('"' == *string)
                string++;
 
        /* The rest is the value. */
-       roff_setstr(r, name, string, ROFF_as == tok);
+       roff_setstrn(&r->strtab, name, namesz, string, strlen(string),
+           ROFF_as == tok);
        return(ROFF_IGN);
 }
 
@@ -1349,31 +1358,31 @@ roff_getop(const char *v, int *pos, char *res)
        *res = v[*pos];
 
        switch (*res) {
-       case ('+'):
+       case '+':
                /* FALLTHROUGH */
-       case ('-'):
+       case '-':
                /* FALLTHROUGH */
-       case ('*'):
+       case '*':
                /* FALLTHROUGH */
-       case ('/'):
+       case '/':
                /* FALLTHROUGH */
-       case ('%'):
+       case '%':
                /* FALLTHROUGH */
-       case ('&'):
+       case '&':
                /* FALLTHROUGH */
-       case (':'):
+       case ':':
                break;
        case '<':
                switch (v[*pos + 1]) {
-               case ('='):
+               case '=':
                        *res = 'l';
                        (*pos)++;
                        break;
-               case ('>'):
+               case '>':
                        *res = '!';
                        (*pos)++;
                        break;
-               case ('?'):
+               case '?':
                        *res = 'i';
                        (*pos)++;
                        break;
@@ -1383,11 +1392,11 @@ roff_getop(const char *v, int *pos, char *res)
                break;
        case '>':
                switch (v[*pos + 1]) {
-               case ('='):
+               case '=':
                        *res = 'g';
                        (*pos)++;
                        break;
-               case ('?'):
+               case '?':
                        *res = 'a';
                        (*pos)++;
                        break;
@@ -1422,9 +1431,16 @@ roff_evalpar(const char *v, int *pos, int *res)
        if ( ! roff_evalnum(v, pos, res, 1))
                return(0);
 
-       /* If the trailing parenthesis is missing, ignore the error. */
+       /*
+        * Omission of the closing parenthesis
+        * is an error in validation mode,
+        * but ignored in evaluation mode.
+        */
+
        if (')' == v[*pos])
                (*pos)++;
+       else if (NULL == res)
+               return(0);
 
        return(1);
 }
@@ -1470,51 +1486,54 @@ roff_evalnum(const char *v, int *pos, int *res, int skipwhite)
                        while (isspace((unsigned char)v[*pos]))
                                (*pos)++;
 
+               if (NULL == res)
+                       continue;
+
                switch (operator) {
-               case ('+'):
+               case '+':
                        *res += operand2;
                        break;
-               case ('-'):
+               case '-':
                        *res -= operand2;
                        break;
-               case ('*'):
+               case '*':
                        *res *= operand2;
                        break;
-               case ('/'):
+               case '/':
                        *res /= operand2;
                        break;
-               case ('%'):
+               case '%':
                        *res %= operand2;
                        break;
-               case ('<'):
+               case '<':
                        *res = *res < operand2;
                        break;
-               case ('>'):
+               case '>':
                        *res = *res > operand2;
                        break;
-               case ('l'):
+               case 'l':
                        *res = *res <= operand2;
                        break;
-               case ('g'):
+               case 'g':
                        *res = *res >= operand2;
                        break;
-               case ('='):
+               case '=':
                        *res = *res == operand2;
                        break;
-               case ('!'):
+               case '!':
                        *res = *res != operand2;
                        break;
-               case ('&'):
+               case '&':
                        *res = *res && operand2;
                        break;
-               case (':'):
+               case ':':
                        *res = *res || operand2;
                        break;
-               case ('i'):
+               case 'i':
                        if (operand2 < *res)
                                *res = operand2;
                        break;
-               case ('a'):
+               case 'a':
                        if (operand2 > *res)
                                *res = operand2;
                        break;
@@ -1565,17 +1584,17 @@ roff_getregro(const char *name)
 {
 
        switch (*name) {
-       case ('A'):  /* ASCII approximation mode is always off. */
+       case 'A':  /* ASCII approximation mode is always off. */
                return(0);
-       case ('g'):  /* Groff compatibility mode is always on. */
+       case 'g':  /* Groff compatibility mode is always on. */
                return(1);
-       case ('H'):  /* Fixed horizontal resolution. */
+       case 'H':  /* Fixed horizontal resolution. */
                return (24);
-       case ('j'):  /* Always adjust left margin only. */
+       case 'j':  /* Always adjust left margin only. */
                return(0);
-       case ('T'):  /* Some output device is always defined. */
+       case 'T':  /* Some output device is always defined. */
                return(1);
-       case ('V'):  /* Fixed vertical resolution. */
+       case 'V':  /* Fixed vertical resolution. */
                return (40);
        default:
                return (-1);
@@ -1637,13 +1656,19 @@ roff_freereg(struct roffreg *reg)
 static enum rofferr
 roff_nr(ROFF_ARGS)
 {
-       const char      *key;
-       char            *val;
+       char            *key, *val;
+       size_t           keysz;
        int              iv;
        char             sign;
 
-       val = *bufp + pos;
-       key = roff_getname(r, &val, ln, pos);
+       key = val = *bufp + pos;
+       if ('\0' == *key)
+               return(ROFF_IGN);
+
+       keysz = roff_getname(r, &val, ln, pos);
+       if ('\\' == key[keysz])
+               return(ROFF_IGN);
+       key[keysz] = '\0';
 
        sign = *val;
        if ('+' == sign || '-' == sign)
@@ -1659,11 +1684,14 @@ static enum rofferr
 roff_rr(ROFF_ARGS)
 {
        struct roffreg  *reg, **prev;
-       const char      *name;
-       char            *cp;
+       char            *name, *cp;
+       size_t           namesz;
 
-       cp = *bufp + pos;
-       name = roff_getname(r, &cp, ln, pos);
+       name = cp = *bufp + pos;
+       if ('\0' == *name)
+               return(ROFF_IGN);
+       namesz = roff_getname(r, &cp, ln, pos);
+       name[namesz] = '\0';
 
        prev = &r->regtab;
        while (1) {
@@ -1680,23 +1708,24 @@ roff_rr(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_rm(ROFF_ARGS)
 {
        const char       *name;
        char             *cp;
+       size_t            namesz;
 
        cp = *bufp + pos;
        while ('\0' != *cp) {
-               name = roff_getname(r, &cp, ln, (int)(cp - *bufp));
-               if ('\0' != *name)
-                       roff_setstr(r, name, NULL, 0);
+               name = cp;
+               namesz = roff_getname(r, &cp, ln, (int)(cp - *bufp));
+               roff_setstrn(&r->strtab, name, namesz, NULL, 0, 0);
+               if ('\\' == name[namesz])
+                       break;
        }
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_it(ROFF_ARGS)
 {
@@ -1710,7 +1739,7 @@ roff_it(ROFF_ARGS)
        cp[len] = '\0';
        if ((iv = mandoc_strntoi(cp, len, 10)) <= 0) {
                mandoc_msg(MANDOCERR_NUMERIC, r->parse,
-                               ln, ppos, *bufp + 1);
+                   ln, ppos, *bufp + 1);
                return(ROFF_IGN);
        }
        cp += len + 1;
@@ -1721,7 +1750,6 @@ roff_it(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_Dd(ROFF_ARGS)
 {
@@ -1734,7 +1762,6 @@ roff_Dd(ROFF_ARGS)
        return(ROFF_CONT);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_TH(ROFF_ARGS)
 {
@@ -1747,7 +1774,6 @@ roff_TH(ROFF_ARGS)
        return(ROFF_CONT);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_TE(ROFF_ARGS)
 {
@@ -1760,7 +1786,6 @@ roff_TE(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_T_(ROFF_ARGS)
 {
@@ -1783,7 +1808,7 @@ roff_closeeqn(struct roff *r)
 #endif
 
 static void
-roff_openeqn(struct roff *r, const char *name, int line, 
+roff_openeqn(struct roff *r, const char *name, int line,
                int offs, const char *buf)
 {
        struct eqn_node *e;
@@ -1805,7 +1830,6 @@ roff_openeqn(struct roff *r, const char *name, int line,
        }
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_EQ(ROFF_ARGS)
 {
@@ -1814,7 +1838,6 @@ roff_EQ(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_EN(ROFF_ARGS)
 {
@@ -1823,7 +1846,6 @@ roff_EN(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_TS(ROFF_ARGS)
 {
@@ -1845,7 +1867,6 @@ roff_TS(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_cc(ROFF_ARGS)
 {
@@ -1862,7 +1883,6 @@ roff_cc(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_tr(ROFF_ARGS)
 {
@@ -1884,9 +1904,9 @@ roff_tr(ROFF_ARGS)
                if ('\\' == *first) {
                        esc = mandoc_escape(&p, NULL, NULL);
                        if (ESCAPE_ERROR == esc) {
-                               mandoc_msg
-                                       (MANDOCERR_BADESCAPE, r->parse, 
-                                        ln, (int)(p - *bufp), NULL);
+                               mandoc_msg(MANDOCERR_BADESCAPE,
+                                   r->parse, ln,
+                                   (int)(p - *bufp), NULL);
                                return(ROFF_IGN);
                        }
                        fsz = (size_t)(p - first);
@@ -1896,28 +1916,28 @@ roff_tr(ROFF_ARGS)
                if ('\\' == *second) {
                        esc = mandoc_escape(&p, NULL, NULL);
                        if (ESCAPE_ERROR == esc) {
-                               mandoc_msg
-                                       (MANDOCERR_BADESCAPE, r->parse, 
-                                        ln, (int)(p - *bufp), NULL);
+                               mandoc_msg(MANDOCERR_BADESCAPE,
+                                   r->parse, ln,
+                                   (int)(p - *bufp), NULL);
                                return(ROFF_IGN);
                        }
                        ssz = (size_t)(p - second);
                } else if ('\0' == *second) {
-                       mandoc_msg(MANDOCERR_ARGCOUNT, r->parse, 
-                                       ln, (int)(p - *bufp), NULL);
+                       mandoc_msg(MANDOCERR_ARGCOUNT, r->parse,
+                           ln, (int)(p - *bufp), NULL);
                        second = " ";
                        p--;
                }
 
                if (fsz > 1) {
-                       roff_setstrn(&r->xmbtab, first, 
-                                       fsz, second, ssz, 0);
+                       roff_setstrn(&r->xmbtab, first, fsz,
+                           second, ssz, 0);
                        continue;
                }
 
                if (NULL == r->xtab)
-                       r->xtab = mandoc_calloc
-                               (128, sizeof(struct roffstr));
+                       r->xtab = mandoc_calloc(128,
+                           sizeof(struct roffstr));
 
                free(r->xtab[(int)*first].p);
                r->xtab[(int)*first].p = mandoc_strndup(second, ssz);
@@ -1927,13 +1947,13 @@ roff_tr(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_so(ROFF_ARGS)
 {
        char *name;
 
-       mandoc_msg(MANDOCERR_SO, r->parse, ln, ppos, NULL);
+       name = *bufp + pos;
+       mandoc_vmsg(MANDOCERR_SO, r->parse, ln, ppos, ".so %s", name);
 
        /*
         * Handle `so'.  Be EXTREMELY careful, as we shouldn't be
@@ -1942,9 +1962,9 @@ roff_so(ROFF_ARGS)
         * or using absolute paths.
         */
 
-       name = *bufp + pos;
        if ('/' == *name || strstr(name, "../") || strstr(name, "/..")) {
-               mandoc_msg(MANDOCERR_SOPATH, r->parse, ln, pos, NULL);
+               mandoc_vmsg(MANDOCERR_SO_PATH, r->parse, ln, ppos,
+                   ".so %s", name);
                return(ROFF_ERR);
        }
 
@@ -1952,7 +1972,6 @@ roff_so(ROFF_ARGS)
        return(ROFF_SO);
 }
 
-/* ARGSUSED */
 static enum rofferr
 roff_userdef(ROFF_ARGS)
 {
@@ -1981,14 +2000,9 @@ roff_userdef(ROFF_ARGS)
                        cp += 2;
                        continue;
                }
-
-               *szp = strlen(n1) - 3 + strlen(arg[i]) + 1;
-               n2 = mandoc_malloc(*szp);
-
-               strlcpy(n2, n1, (size_t)(cp - n1 + 1));
-               strlcat(n2, arg[i], *szp);
-               strlcat(n2, cp + 3, *szp);
-
+               *cp = '\0';
+               *szp = mandoc_asprintf(&n2, "%s%s%s",
+                   n1, arg[i], cp + 3) + 1;
                cp = n2 + (cp - n1);
                free(n1);
                n1 = n2;
@@ -2007,37 +2021,39 @@ roff_userdef(ROFF_ARGS)
           ROFF_REPARSE : ROFF_APPEND);
 }
 
-static char *
+static size_t
 roff_getname(struct roff *r, char **cpp, int ln, int pos)
 {
        char     *name, *cp;
+       size_t    namesz;
 
        name = *cpp;
        if ('\0' == *name)
-               return(name);
+               return(0);
 
-       /* Read until end of name. */
-       for (cp = name; '\0' != *cp && ' ' != *cp; cp++) {
+       /* Read until end of name and terminate it with NUL. */
+       for (cp = name; 1; cp++) {
+               if ('\0' == *cp || ' ' == *cp) {
+                       namesz = cp - name;
+                       break;
+               }
                if ('\\' != *cp)
                        continue;
                cp++;
                if ('\\' == *cp)
                        continue;
+               namesz = cp - name - 1;
                mandoc_msg(MANDOCERR_NAMESC, r->parse, ln, pos, NULL);
-               *cp = '\0';
-               name = cp;
+               mandoc_escape((const char **)&cp, NULL, NULL);
+               break;
        }
 
-       /* Nil-terminate name. */
-       if ('\0' != *cp)
-               *(cp++) = '\0';
-
        /* Read past spaces. */
        while (' ' == *cp)
                cp++;
 
        *cpp = cp;
-       return(name);
+       return(namesz);
 }
 
 /*
@@ -2053,7 +2069,7 @@ roff_setstr(struct roff *r, const char *name, const char *string,
 {
 
        roff_setstrn(&r->strtab, name, strlen(name), string,
-                       string ? strlen(string) : 0, append);
+           string ? strlen(string) : 0, append);
 }
 
 static void
@@ -2068,7 +2084,8 @@ roff_setstrn(struct roffkv **r, const char *name, size_t namesz,
        /* Search for an existing string with the same name. */
        n = *r;
 
-       while (n && strcmp(name, n->key.p))
+       while (n && (namesz != n->key.sz ||
+                       strncmp(n->key.p, name, namesz)))
                n = n->next;
 
        if (NULL == n) {
@@ -2134,8 +2151,8 @@ roff_getstrn(const struct roff *r, const char *name, size_t len)
        int i;
 
        for (n = r->strtab; n; n = n->next)
-               if (0 == strncmp(name, n->key.p, len) && 
-                               '\0' == n->key.p[(int)len])
+               if (0 == strncmp(name, n->key.p, len) &&
+                   '\0' == n->key.p[(int)len])
                        return(n->val.p);
 
        for (i = 0; i < PREDEFS_MAX; i++)
@@ -2162,14 +2179,14 @@ roff_freestr(struct roffkv *r)
 const struct tbl_span *
 roff_span(const struct roff *r)
 {
-       
+
        return(r->tbl ? tbl_span(r->tbl) : NULL);
 }
 
 const struct eqn *
 roff_eqn(const struct roff *r)
 {
-       
+
        return(r->last_eqn ? &r->last_eqn->eqn : NULL);
 }
 
@@ -2228,8 +2245,8 @@ roff_strdup(const struct roff *r, const char *p)
                         * Append the match to the array and move
                         * forward by its keysize.
                         */
-                       res = mandoc_realloc
-                               (res, ssz + cp->val.sz + 1);
+                       res = mandoc_realloc(res,
+                           ssz + cp->val.sz + 1);
                        memcpy(res + ssz, cp->val.p, cp->val.sz);
                        ssz += cp->val.sz;
                        p += (int)cp->key.sz;
@@ -2250,8 +2267,8 @@ roff_strdup(const struct roff *r, const char *p)
                        memcpy(res + ssz, pp, sz);
                        break;
                }
-               /* 
-                * We bail out on bad escapes. 
+               /*
+                * We bail out on bad escapes.
                 * No need to warn: we already did so when
                 * roff_res() was called.
                 */
@@ -2266,7 +2283,7 @@ roff_strdup(const struct roff *r, const char *p)
 }
 
 /*
- * Find out whether a line is a macro line or not.  
+ * Find out whether a line is a macro line or not.
  * If it is, adjust the current position and return one; if it isn't,
  * return zero and don't change the current position.
  * If the control character has been set with `.cc', then let that grain