]> git.cameronkatri.com Git - mandoc.git/blobdiff - roff.c
Minimal implementation of the read-only number register \n(.$
[mandoc.git] / roff.c
diff --git a/roff.c b/roff.c
index 4ec05eb95f861d22bf31017409d8bc34c102f433..d28cea9c414b3238a37bd23daa9a9bfda67b795a 100644 (file)
--- a/roff.c
+++ b/roff.c
@@ -1,6 +1,6 @@
-/*     $Id: roff.c,v 1.259 2015/01/30 00:19:46 schwarze Exp $ */
+/*     $Id: roff.c,v 1.273 2015/08/29 20:26:04 schwarze Exp $ */
 /*
- * Copyright (c) 2010, 2011, 2012, 2014 Kristaps Dzonsons <kristaps@bsd.lv>
+ * Copyright (c) 2008-2012, 2014 Kristaps Dzonsons <kristaps@bsd.lv>
  * Copyright (c) 2010-2015 Ingo Schwarze <schwarze@openbsd.org>
  *
  * Permission to use, copy, modify, and distribute this software for any
@@ -28,7 +28,9 @@
 
 #include "mandoc.h"
 #include "mandoc_aux.h"
+#include "roff.h"
 #include "libmandoc.h"
+#include "roff_int.h"
 #include "libroff.h"
 
 /* Maximum number of nested if-else conditionals. */
@@ -37,6 +39,8 @@
 /* Maximum number of string expansions per line, to break infinite loops. */
 #define        EXPAND_LIMIT    1000
 
+/* --- data types --------------------------------------------------------- */
+
 enum   rofft {
        ROFF_ab,
        ROFF_ad,
@@ -331,6 +335,7 @@ struct      roff {
        int              rstacksz; /* current size limit of rstack */
        int              rstackpos; /* position in rstack */
        int              format; /* current file in mdoc or man format */
+       int              argc; /* number of args of the last macro */
        char             control; /* control character */
 };
 
@@ -373,6 +378,8 @@ struct      predef {
 #define        PREDEF(__name, __str) \
        { (__name), (__str) },
 
+/* --- function prototypes ------------------------------------------------ */
+
 static enum rofft       roffhash_find(const char *, size_t);
 static void             roffhash_init(void);
 static void             roffnode_cleanscope(struct roff *);
@@ -391,27 +398,31 @@ static    enum rofferr     roff_cond_text(ROFF_ARGS);
 static enum rofferr     roff_cond_sub(ROFF_ARGS);
 static enum rofferr     roff_ds(ROFF_ARGS);
 static enum rofferr     roff_eqndelim(struct roff *, struct buf *, int);
-static int              roff_evalcond(struct roff *r, int,
-                               const char *, int *);
+static int              roff_evalcond(struct roff *r, int, char *, int *);
 static int              roff_evalnum(struct roff *, int,
                                const char *, int *, int *, int);
 static int              roff_evalpar(struct roff *, int,
-                               const char *, int *, int *);
+                               const char *, int *, int *, int);
 static int              roff_evalstrcond(const char *, int *);
 static void             roff_free1(struct roff *);
 static void             roff_freereg(struct roffreg *);
 static void             roff_freestr(struct roffkv *);
 static size_t           roff_getname(struct roff *, char **, int, int);
-static int              roff_getnum(const char *, int *, int *);
+static int              roff_getnum(const char *, int *, int *, int);
 static int              roff_getop(const char *, int *, char *);
 static int              roff_getregn(const struct roff *,
                                const char *, size_t);
-static int              roff_getregro(const char *name);
+static int              roff_getregro(const struct roff *,
+                               const char *name);
 static const char      *roff_getstrn(const struct roff *,
                                const char *, size_t);
+static int              roff_hasregn(const struct roff *,
+                               const char *, size_t);
 static enum rofferr     roff_insec(ROFF_ARGS);
 static enum rofferr     roff_it(ROFF_ARGS);
 static enum rofferr     roff_line_ignore(ROFF_ARGS);
+static void             roff_man_alloc1(struct roff_man *);
+static void             roff_man_free1(struct roff_man *);
 static enum rofferr     roff_nr(ROFF_ARGS);
 static enum rofft       roff_parse(struct roff *, char *, int *,
                                int, int);
@@ -435,12 +446,17 @@ static    enum rofferr     roff_T_(ROFF_ARGS);
 static enum rofferr     roff_unsupp(ROFF_ARGS);
 static enum rofferr     roff_userdef(ROFF_ARGS);
 
+/* --- constant data ------------------------------------------------------ */
+
 /* See roffhash_find() */
 
 #define        ASCII_HI         126
 #define        ASCII_LO         33
 #define        HASHWIDTH       (ASCII_HI - ASCII_LO + 1)
 
+#define        ROFFNUM_SCALE   (1 << 0)  /* Honour scaling in roff_getnum(). */
+#define        ROFFNUM_WHITE   (1 << 1)  /* Skip whitespace in roff_evalnum(). */
+
 static struct roffmac  *hash[HASHWIDTH];
 
 static struct roffmac   roffs[ROFF_MAX] = {
@@ -728,6 +744,8 @@ static      int      roffit_lines;  /* number of lines to delay */
 static char    *roffit_macro;  /* nil-terminated macro line */
 
 
+/* --- request table ------------------------------------------------------ */
+
 static void
 roffhash_init(void)
 {
@@ -780,6 +798,8 @@ roffhash_find(const char *p, size_t s)
        return(ROFF_MAX);
 }
 
+/* --- stack of request blocks -------------------------------------------- */
+
 /*
  * Pop the current node off of the stack of roff instructions currently
  * pending.
@@ -820,6 +840,8 @@ roffnode_push(struct roff *r, enum rofft tok, const char *name,
        r->last = p;
 }
 
+/* --- roff parser state data management ---------------------------------- */
+
 static void
 roff_free1(struct roff *r)
 {
@@ -895,6 +917,371 @@ roff_alloc(struct mparse *parse, const struct mchars *mchars, int options)
        return(r);
 }
 
+/* --- syntax tree state data management ---------------------------------- */
+
+static void
+roff_man_free1(struct roff_man *man)
+{
+
+       if (man->first != NULL)
+               roff_node_delete(man, man->first);
+       free(man->meta.msec);
+       free(man->meta.vol);
+       free(man->meta.os);
+       free(man->meta.arch);
+       free(man->meta.title);
+       free(man->meta.name);
+       free(man->meta.date);
+}
+
+static void
+roff_man_alloc1(struct roff_man *man)
+{
+
+       memset(&man->meta, 0, sizeof(man->meta));
+       man->first = mandoc_calloc(1, sizeof(*man->first));
+       man->first->type = ROFFT_ROOT;
+       man->last = man->first;
+       man->last_es = NULL;
+       man->flags = 0;
+       man->macroset = MACROSET_NONE;
+       man->lastsec = man->lastnamed = SEC_NONE;
+       man->next = ROFF_NEXT_CHILD;
+}
+
+void
+roff_man_reset(struct roff_man *man)
+{
+
+       roff_man_free1(man);
+       roff_man_alloc1(man);
+}
+
+void
+roff_man_free(struct roff_man *man)
+{
+
+       roff_man_free1(man);
+       free(man);
+}
+
+struct roff_man *
+roff_man_alloc(struct roff *roff, struct mparse *parse,
+       const char *defos, int quick)
+{
+       struct roff_man *man;
+
+       man = mandoc_calloc(1, sizeof(*man));
+       man->parse = parse;
+       man->roff = roff;
+       man->defos = defos;
+       man->quick = quick;
+       roff_man_alloc1(man);
+       return(man);
+}
+
+/* --- syntax tree handling ----------------------------------------------- */
+
+struct roff_node *
+roff_node_alloc(struct roff_man *man, int line, int pos,
+       enum roff_type type, int tok)
+{
+       struct roff_node        *n;
+
+       n = mandoc_calloc(1, sizeof(*n));
+       n->line = line;
+       n->pos = pos;
+       n->tok = tok;
+       n->type = type;
+       n->sec = man->lastsec;
+
+       if (man->flags & MDOC_SYNOPSIS)
+               n->flags |= MDOC_SYNPRETTY;
+       else
+               n->flags &= ~MDOC_SYNPRETTY;
+       if (man->flags & MDOC_NEWLINE)
+               n->flags |= MDOC_LINE;
+       man->flags &= ~MDOC_NEWLINE;
+
+       return(n);
+}
+
+void
+roff_node_append(struct roff_man *man, struct roff_node *n)
+{
+
+       switch (man->next) {
+       case ROFF_NEXT_SIBLING:
+               man->last->next = n;
+               n->prev = man->last;
+               n->parent = man->last->parent;
+               break;
+       case ROFF_NEXT_CHILD:
+               man->last->child = n;
+               n->parent = man->last;
+               break;
+       default:
+               abort();
+               /* NOTREACHED */
+       }
+       n->parent->nchild++;
+       n->parent->last = n;
+
+       /*
+        * Copy over the normalised-data pointer of our parent.  Not
+        * everybody has one, but copying a null pointer is fine.
+        */
+
+       switch (n->type) {
+       case ROFFT_BODY:
+               if (n->end != ENDBODY_NOT)
+                       break;
+               /* FALLTHROUGH */
+       case ROFFT_TAIL:
+               /* FALLTHROUGH */
+       case ROFFT_HEAD:
+               n->norm = n->parent->norm;
+               break;
+       default:
+               break;
+       }
+
+       if (man->macroset == MACROSET_MDOC)
+               mdoc_valid_pre(man, n);
+
+       switch (n->type) {
+       case ROFFT_HEAD:
+               assert(n->parent->type == ROFFT_BLOCK);
+               n->parent->head = n;
+               break;
+       case ROFFT_BODY:
+               if (n->end)
+                       break;
+               assert(n->parent->type == ROFFT_BLOCK);
+               n->parent->body = n;
+               break;
+       case ROFFT_TAIL:
+               assert(n->parent->type == ROFFT_BLOCK);
+               n->parent->tail = n;
+               break;
+       default:
+               break;
+       }
+       man->last = n;
+}
+
+void
+roff_word_alloc(struct roff_man *man, int line, int pos, const char *word)
+{
+       struct roff_node        *n;
+
+       n = roff_node_alloc(man, line, pos, ROFFT_TEXT, TOKEN_NONE);
+       n->string = roff_strdup(man->roff, word);
+       roff_node_append(man, n);
+       if (man->macroset == MACROSET_MDOC)
+               mdoc_valid_post(man);
+       else
+               man_valid_post(man);
+       man->next = ROFF_NEXT_SIBLING;
+}
+
+void
+roff_word_append(struct roff_man *man, const char *word)
+{
+       struct roff_node        *n;
+       char                    *addstr, *newstr;
+
+       n = man->last;
+       addstr = roff_strdup(man->roff, word);
+       mandoc_asprintf(&newstr, "%s %s", n->string, addstr);
+       free(addstr);
+       free(n->string);
+       n->string = newstr;
+       man->next = ROFF_NEXT_SIBLING;
+}
+
+void
+roff_elem_alloc(struct roff_man *man, int line, int pos, int tok)
+{
+       struct roff_node        *n;
+
+       n = roff_node_alloc(man, line, pos, ROFFT_ELEM, tok);
+       roff_node_append(man, n);
+       man->next = ROFF_NEXT_CHILD;
+}
+
+struct roff_node *
+roff_block_alloc(struct roff_man *man, int line, int pos, int tok)
+{
+       struct roff_node        *n;
+
+       n = roff_node_alloc(man, line, pos, ROFFT_BLOCK, tok);
+       roff_node_append(man, n);
+       man->next = ROFF_NEXT_CHILD;
+       return(n);
+}
+
+struct roff_node *
+roff_head_alloc(struct roff_man *man, int line, int pos, int tok)
+{
+       struct roff_node        *n;
+
+       n = roff_node_alloc(man, line, pos, ROFFT_HEAD, tok);
+       roff_node_append(man, n);
+       man->next = ROFF_NEXT_CHILD;
+       return(n);
+}
+
+struct roff_node *
+roff_body_alloc(struct roff_man *man, int line, int pos, int tok)
+{
+       struct roff_node        *n;
+
+       n = roff_node_alloc(man, line, pos, ROFFT_BODY, tok);
+       roff_node_append(man, n);
+       man->next = ROFF_NEXT_CHILD;
+       return(n);
+}
+
+void
+roff_addeqn(struct roff_man *man, const struct eqn *eqn)
+{
+       struct roff_node        *n;
+
+       n = roff_node_alloc(man, eqn->ln, eqn->pos, ROFFT_EQN, TOKEN_NONE);
+       n->eqn = eqn;
+       if (eqn->ln > man->last->line)
+               n->flags |= MDOC_LINE;
+       roff_node_append(man, n);
+       man->next = ROFF_NEXT_SIBLING;
+}
+
+void
+roff_addtbl(struct roff_man *man, const struct tbl_span *tbl)
+{
+       struct roff_node        *n;
+
+       if (man->macroset == MACROSET_MAN)
+               man_breakscope(man, TOKEN_NONE);
+       n = roff_node_alloc(man, tbl->line, 0, ROFFT_TBL, TOKEN_NONE);
+       n->span = tbl;
+       roff_node_append(man, n);
+       if (man->macroset == MACROSET_MDOC)
+               mdoc_valid_post(man);
+       else
+               man_valid_post(man);
+       man->next = ROFF_NEXT_SIBLING;
+}
+
+void
+roff_node_unlink(struct roff_man *man, struct roff_node *n)
+{
+
+       /* Adjust siblings. */
+
+       if (n->prev)
+               n->prev->next = n->next;
+       if (n->next)
+               n->next->prev = n->prev;
+
+       /* Adjust parent. */
+
+       if (n->parent != NULL) {
+               n->parent->nchild--;
+               if (n->parent->child == n)
+                       n->parent->child = n->next;
+               if (n->parent->last == n)
+                       n->parent->last = n->prev;
+       }
+
+       /* Adjust parse point. */
+
+       if (man == NULL)
+               return;
+       if (man->last == n) {
+               if (n->prev == NULL) {
+                       man->last = n->parent;
+                       man->next = ROFF_NEXT_CHILD;
+               } else {
+                       man->last = n->prev;
+                       man->next = ROFF_NEXT_SIBLING;
+               }
+       }
+       if (man->first == n)
+               man->first = NULL;
+}
+
+void
+roff_node_free(struct roff_node *n)
+{
+
+       if (n->args != NULL)
+               mdoc_argv_free(n->args);
+       if (n->type == ROFFT_BLOCK || n->type == ROFFT_ELEM)
+               free(n->norm);
+       free(n->string);
+       free(n);
+}
+
+void
+roff_node_delete(struct roff_man *man, struct roff_node *n)
+{
+
+       while (n->child != NULL)
+               roff_node_delete(man, n->child);
+       assert(n->nchild == 0);
+       roff_node_unlink(man, n);
+       roff_node_free(n);
+}
+
+void
+deroff(char **dest, const struct roff_node *n)
+{
+       char    *cp;
+       size_t   sz;
+
+       if (n->type != ROFFT_TEXT) {
+               for (n = n->child; n != NULL; n = n->next)
+                       deroff(dest, n);
+               return;
+       }
+
+       /* Skip leading whitespace and escape sequences. */
+
+       cp = n->string;
+       while (*cp != '\0') {
+               if ('\\' == *cp) {
+                       cp++;
+                       mandoc_escape((const char **)&cp, NULL, NULL);
+               } else if (isspace((unsigned char)*cp))
+                       cp++;
+               else
+                       break;
+       }
+
+       /* Skip trailing whitespace. */
+
+       for (sz = strlen(cp); sz; sz--)
+               if ( ! isspace((unsigned char)cp[sz-1]))
+                       break;
+
+       /* Skip empty strings. */
+
+       if (sz == 0)
+               return;
+
+       if (*dest == NULL) {
+               *dest = mandoc_strndup(cp, sz);
+               return;
+       }
+
+       mandoc_asprintf(&cp, "%s %*s", *dest, (int)sz, cp);
+       free(*dest);
+       *dest = cp;
+}
+
+/* --- main functions of the roff parser ---------------------------------- */
+
 /*
  * In the current line, expand escape sequences that tend to get
  * used in numerical expressions and conditional requests.
@@ -1050,7 +1437,8 @@ roff_res(struct roff *r, struct buf *buf, int ln, int pos)
                case 'B':
                        npos = 0;
                        ubuf[0] = arg_complete &&
-                           roff_evalnum(r, ln, stnam, &npos, NULL, 0) &&
+                           roff_evalnum(r, ln, stnam, &npos,
+                             NULL, ROFFNUM_SCALE) &&
                            stnam + npos + 1 == cp ? '1' : '0';
                        ubuf[1] = '\0';
                        break;
@@ -1124,6 +1512,8 @@ roff_parsetext(struct buf *buf, int pos, int *offs)
                        esc = mandoc_escape((const char **)&p, NULL, NULL);
                        if (esc == ESCAPE_ERROR)
                                break;
+                       while (*p == '-')
+                               p++;
                        continue;
                } else if (p == start) {
                        p++;
@@ -1311,6 +1701,8 @@ roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)
        return(t);
 }
 
+/* --- handling of request blocks ----------------------------------------- */
+
 static enum rofferr
 roff_cblock(ROFF_ARGS)
 {
@@ -1621,6 +2013,8 @@ roff_cond_text(ROFF_ARGS)
        return(rr ? ROFF_CONT : ROFF_IGN);
 }
 
+/* --- handling of numeric and conditional expressions -------------------- */
+
 /*
  * Parse a single signed integer number.  Stop at the first non-digit.
  * If there is at least one digit, return success and advance the
@@ -1628,18 +2022,22 @@ roff_cond_text(ROFF_ARGS)
  * Ignore overflows, treat them just like the C language.
  */
 static int
-roff_getnum(const char *v, int *pos, int *res)
+roff_getnum(const char *v, int *pos, int *res, int flags)
 {
-       int      myres, n, p;
+       int      myres, scaled, n, p;
 
        if (NULL == res)
                res = &myres;
 
        p = *pos;
        n = v[p] == '-';
-       if (n)
+       if (n || v[p] == '+')
                p++;
 
+       if (flags & ROFFNUM_WHITE)
+               while (isspace((unsigned char)v[p]))
+                       p++;
+
        for (*res = 0; isdigit((unsigned char)v[p]); p++)
                *res = 10 * *res + v[p] - '0';
        if (p == *pos + n)
@@ -1652,39 +2050,40 @@ roff_getnum(const char *v, int *pos, int *res)
 
        switch (v[p]) {
        case 'f':
-               *res *= 65536;
+               scaled = *res * 65536;
                break;
        case 'i':
-               *res *= 240;
+               scaled = *res * 240;
                break;
        case 'c':
-               *res *= 240;
-               *res /= 2.54;
+               scaled = *res * 240 / 2.54;
                break;
        case 'v':
                /* FALLTROUGH */
        case 'P':
-               *res *= 40;
+               scaled = *res * 40;
                break;
        case 'm':
                /* FALLTROUGH */
        case 'n':
-               *res *= 24;
+               scaled = *res * 24;
                break;
        case 'p':
-               *res *= 10;
-               *res /= 3;
+               scaled = *res * 10 / 3;
                break;
        case 'u':
+               scaled = *res;
                break;
        case 'M':
-               *res *= 6;
-               *res /= 25;
+               scaled = *res * 6 / 25;
                break;
        default:
+               scaled = *res;
                p--;
                break;
        }
+       if (flags & ROFFNUM_SCALE)
+               *res = scaled;
 
        *pos = p + 1;
        return(1);
@@ -1738,8 +2137,10 @@ out:
  * or string condition.
  */
 static int
-roff_evalcond(struct roff *r, int ln, const char *v, int *pos)
+roff_evalcond(struct roff *r, int ln, char *v, int *pos)
 {
+       char    *cp, *name;
+       size_t   sz;
        int      number, savepos, wanttrue;
 
        if ('!' == v[*pos]) {
@@ -1762,19 +2163,22 @@ roff_evalcond(struct roff *r, int ln, const char *v, int *pos)
                /* FALLTHROUGH */
        case 'e':
                /* FALLTHROUGH */
-       case 'r':
-               /* FALLTHROUGH */
        case 't':
                /* FALLTHROUGH */
        case 'v':
                (*pos)++;
                return(!wanttrue);
+       case 'r':
+               cp = name = v + ++*pos;
+               sz = roff_getname(r, &cp, ln, *pos);
+               *pos = cp - v;
+               return((sz && roff_hasregn(r, name, sz)) == wanttrue);
        default:
                break;
        }
 
        savepos = *pos;
-       if (roff_evalnum(r, ln, v, pos, &number, 0))
+       if (roff_evalnum(r, ln, v, pos, &number, ROFFNUM_SCALE))
                return((number > 0) == wanttrue);
        else if (*pos == savepos)
                return(roff_evalstrcond(v, pos) == wanttrue);
@@ -1863,6 +2267,8 @@ roff_cond(ROFF_ARGS)
        if (buf->buf[pos] == '\\' && buf->buf[pos + 1] == '{') {
                r->last->endspan = -1;
                pos += 2;
+               while (buf->buf[pos] == ' ')
+                       pos++;
                goto out;
        }
 
@@ -1997,14 +2403,14 @@ roff_getop(const char *v, int *pos, char *res)
  */
 static int
 roff_evalpar(struct roff *r, int ln,
-       const char *v, int *pos, int *res)
+       const char *v, int *pos, int *res, int flags)
 {
 
        if ('(' != v[*pos])
-               return(roff_getnum(v, pos, res));
+               return(roff_getnum(v, pos, res, flags));
 
        (*pos)++;
-       if ( ! roff_evalnum(r, ln, v, pos, res, 1))
+       if ( ! roff_evalnum(r, ln, v, pos, res, flags | ROFFNUM_WHITE))
                return(0);
 
        /*
@@ -2027,7 +2433,7 @@ roff_evalpar(struct roff *r, int ln,
  */
 static int
 roff_evalnum(struct roff *r, int ln, const char *v,
-       int *pos, int *res, int skipwhite)
+       int *pos, int *res, int flags)
 {
        int              mypos, operand2;
        char             operator;
@@ -2037,29 +2443,29 @@ roff_evalnum(struct roff *r, int ln, const char *v,
                pos = &mypos;
        }
 
-       if (skipwhite)
+       if (flags & ROFFNUM_WHITE)
                while (isspace((unsigned char)v[*pos]))
                        (*pos)++;
 
-       if ( ! roff_evalpar(r, ln, v, pos, res))
+       if ( ! roff_evalpar(r, ln, v, pos, res, flags))
                return(0);
 
        while (1) {
-               if (skipwhite)
+               if (flags & ROFFNUM_WHITE)
                        while (isspace((unsigned char)v[*pos]))
                                (*pos)++;
 
                if ( ! roff_getop(v, pos, &operator))
                        break;
 
-               if (skipwhite)
+               if (flags & ROFFNUM_WHITE)
                        while (isspace((unsigned char)v[*pos]))
                                (*pos)++;
 
-               if ( ! roff_evalpar(r, ln, v, pos, &operand2))
+               if ( ! roff_evalpar(r, ln, v, pos, &operand2, flags))
                        return(0);
 
-               if (skipwhite)
+               if (flags & ROFFNUM_WHITE)
                        while (isspace((unsigned char)v[*pos]))
                                (*pos)++;
 
@@ -2133,6 +2539,8 @@ roff_evalnum(struct roff *r, int ln, const char *v,
        return(1);
 }
 
+/* --- register management ------------------------------------------------ */
+
 void
 roff_setreg(struct roff *r, const char *name, int val, char sign)
 {
@@ -2169,10 +2577,12 @@ roff_setreg(struct roff *r, const char *name, int val, char sign)
  * were to turn up, another special value would have to be chosen.
  */
 static int
-roff_getregro(const char *name)
+roff_getregro(const struct roff *r, const char *name)
 {
 
        switch (*name) {
+       case '$':  /* Number of arguments of the last macro evaluated. */
+               return(r->argc);
        case 'A':  /* ASCII approximation mode is always off. */
                return(0);
        case 'g':  /* Groff compatibility mode is always on. */
@@ -2197,7 +2607,7 @@ roff_getreg(const struct roff *r, const char *name)
        int              val;
 
        if ('.' == name[0] && '\0' != name[1] && '\0' == name[2]) {
-               val = roff_getregro(name + 1);
+               val = roff_getregro(r, name + 1);
                if (-1 != val)
                        return (val);
        }
@@ -2216,7 +2626,7 @@ roff_getregn(const struct roff *r, const char *name, size_t len)
        int              val;
 
        if ('.' == name[0] && 2 == len) {
-               val = roff_getregro(name + 1);
+               val = roff_getregro(r, name + 1);
                if (-1 != val)
                        return (val);
        }
@@ -2229,6 +2639,26 @@ roff_getregn(const struct roff *r, const char *name, size_t len)
        return(0);
 }
 
+static int
+roff_hasregn(const struct roff *r, const char *name, size_t len)
+{
+       struct roffreg  *reg;
+       int              val;
+
+       if ('.' == name[0] && 2 == len) {
+               val = roff_getregro(r, name + 1);
+               if (-1 != val)
+                       return(1);
+       }
+
+       for (reg = r->regtab; reg; reg = reg->next)
+               if (len == reg->key.sz &&
+                   0 == strncmp(name, reg->key.p, len))
+                       return(1);
+
+       return(0);
+}
+
 static void
 roff_freereg(struct roffreg *reg)
 {
@@ -2263,7 +2693,7 @@ roff_nr(ROFF_ARGS)
        if (sign == '+' || sign == '-')
                val++;
 
-       if (roff_evalnum(r, ln, val, NULL, &iv, 0))
+       if (roff_evalnum(r, ln, val, NULL, &iv, ROFFNUM_SCALE))
                roff_setreg(r, key, iv, sign);
 
        return(ROFF_IGN);
@@ -2297,6 +2727,8 @@ roff_rr(ROFF_ARGS)
        return(ROFF_IGN);
 }
 
+/* --- handler functions for roff requests -------------------------------- */
+
 static enum rofferr
 roff_rm(ROFF_ARGS)
 {
@@ -2318,24 +2750,29 @@ roff_rm(ROFF_ARGS)
 static enum rofferr
 roff_it(ROFF_ARGS)
 {
-       char            *cp;
-       size_t           len;
        int              iv;
 
        /* Parse the number of lines. */
-       cp = buf->buf + pos;
-       len = strcspn(cp, " \t");
-       cp[len] = '\0';
-       if ((iv = mandoc_strntoi(cp, len, 10)) <= 0) {
+
+       if ( ! roff_evalnum(r, ln, buf->buf, &pos, &iv, 0)) {
                mandoc_msg(MANDOCERR_IT_NONUM, r->parse,
                    ln, ppos, buf->buf + 1);
                return(ROFF_IGN);
        }
-       cp += len + 1;
 
-       /* Arm the input line trap. */
+       while (isspace((unsigned char)buf->buf[pos]))
+               pos++;
+
+       /*
+        * Arm the input line trap.
+        * Special-casing "an-trap" is an ugly workaround to cope
+        * with DocBook stupidly fiddling with man(7) internals.
+        */
+
        roffit_lines = iv;
-       roffit_macro = mandoc_strdup(cp);
+       roffit_macro = mandoc_strdup(iv != 1 ||
+           strcmp(buf->buf + pos, "an-trap") ?
+           buf->buf + pos : "br");
        return(ROFF_IGN);
 }
 
@@ -2538,7 +2975,8 @@ roff_cc(ROFF_ARGS)
                r->control = 0;
 
        if (*p != '\0')
-               mandoc_msg(MANDOCERR_ARGCOUNT, r->parse, ln, ppos, NULL);
+               mandoc_vmsg(MANDOCERR_ARG_EXCESS, r->parse,
+                   ln, p - buf->buf, "cc ... %s", p);
 
        return(ROFF_IGN);
 }
@@ -2553,7 +2991,7 @@ roff_tr(ROFF_ARGS)
        p = buf->buf + pos;
 
        if (*p == '\0') {
-               mandoc_msg(MANDOCERR_ARGCOUNT, r->parse, ln, ppos, NULL);
+               mandoc_msg(MANDOCERR_REQ_EMPTY, r->parse, ln, ppos, "tr");
                return(ROFF_IGN);
        }
 
@@ -2581,8 +3019,8 @@ roff_tr(ROFF_ARGS)
                        }
                        ssz = (size_t)(p - second);
                } else if (*second == '\0') {
-                       mandoc_msg(MANDOCERR_ARGCOUNT, r->parse,
-                           ln, (int)(p - buf->buf), NULL);
+                       mandoc_vmsg(MANDOCERR_TR_ODD, r->parse,
+                           ln, first - buf->buf, "tr %s", first);
                        second = " ";
                        p--;
                }
@@ -2635,50 +3073,118 @@ roff_so(ROFF_ARGS)
        return(ROFF_SO);
 }
 
+/* --- user defined strings and macros ------------------------------------ */
+
 static enum rofferr
 roff_userdef(ROFF_ARGS)
 {
-       const char       *arg[9];
+       const char       *arg[9], *ap;
        char             *cp, *n1, *n2;
        int               i;
+       size_t            asz, rsz;
 
        /*
         * Collect pointers to macro argument strings
         * and NUL-terminate them.
         */
+
+       r->argc = 0;
        cp = buf->buf + pos;
-       for (i = 0; i < 9; i++)
-               arg[i] = *cp == '\0' ? "" :
-                   mandoc_getarg(r->parse, &cp, ln, &pos);
+       for (i = 0; i < 9; i++) {
+               if (*cp == '\0')
+                       arg[i] = "";
+               else {
+                       arg[i] = mandoc_getarg(r->parse, &cp, ln, &pos);
+                       r->argc = i + 1;
+               }
+       }
 
        /*
         * Expand macro arguments.
         */
-       buf->sz = 0;
-       n1 = cp = mandoc_strdup(r->current_string);
-       while ((cp = strstr(cp, "\\$")) != NULL) {
-               i = cp[2] - '1';
-               if (0 > i || 8 < i) {
-                       /* Not an argument invocation. */
-                       cp += 2;
+
+       buf->sz = strlen(r->current_string) + 1;
+       n1 = cp = mandoc_malloc(buf->sz);
+       memcpy(n1, r->current_string, buf->sz);
+       while (*cp != '\0') {
+
+               /* Scan ahead for the next argument invocation. */
+
+               if (*cp++ != '\\')
                        continue;
+               if (*cp++ != '$')
+                       continue;
+               i = *cp - '1';
+               if (0 > i || 8 < i)
+                       continue;
+               cp -= 2;
+
+               /*
+                * Determine the size of the expanded argument,
+                * taking escaping of quotes into account.
+                */
+
+               asz = 0;
+               for (ap = arg[i]; *ap != '\0'; ap++) {
+                       asz++;
+                       if (*ap == '"')
+                               asz += 3;
+               }
+               if (asz != 3) {
+
+                       /*
+                        * Determine the size of the rest of the
+                        * unexpanded macro, including the NUL.
+                        */
+
+                       rsz = buf->sz - (cp - n1) - 3;
+
+                       /*
+                        * When shrinking, move before
+                        * releasing the storage.
+                        */
+
+                       if (asz < 3)
+                               memmove(cp + asz, cp + 3, rsz);
+
+                       /*
+                        * Resize the storage for the macro
+                        * and readjust the parse pointer.
+                        */
+
+                       buf->sz += asz - 3;
+                       n2 = mandoc_realloc(n1, buf->sz);
+                       cp = n2 + (cp - n1);
+                       n1 = n2;
+
+                       /*
+                        * When growing, make room
+                        * for the expanded argument.
+                        */
+
+                       if (asz > 3)
+                               memmove(cp + asz, cp + 3, rsz);
+               }
+
+               /* Copy the expanded argument, escaping quotes. */
+
+               n2 = cp;
+               for (ap = arg[i]; *ap != '\0'; ap++) {
+                       if (*ap == '"') {
+                               memcpy(n2, "\\(dq", 4);
+                               n2 += 4;
+                       } else
+                               *n2++ = *ap;
                }
-               *cp = '\0';
-               buf->sz = mandoc_asprintf(&n2, "%s%s%s",
-                   n1, arg[i], cp + 3) + 1;
-               cp = n2 + (cp - n1);
-               free(n1);
-               n1 = n2;
        }
 
        /*
         * Replace the macro invocation
         * by the expanded macro.
         */
+
        free(buf->buf);
        buf->buf = n1;
-       if (buf->sz == 0)
-               buf->sz = strlen(buf->buf) + 1;
        *offs = 0;
 
        return(buf->sz > 1 && buf->buf[buf->sz - 2] == '\n' ?
@@ -2843,6 +3349,8 @@ roff_freestr(struct roffkv *r)
        }
 }
 
+/* --- accessors and utility functions ------------------------------------ */
+
 const struct tbl_span *
 roff_span(const struct roff *r)
 {