]> git.cameronkatri.com Git - mandoc.git/blobdiff - mandocdb.c
Finally, represent the man(7) .PP and .HP macros by the natural
[mandoc.git] / mandocdb.c
index 09848f7d057e1fec78b4e979a7f8f3b5f9592213..222350c987b68df9a01c5e50ee7ceb3cc405e24d 100644 (file)
@@ -1,7 +1,8 @@
-/*     $Id: mandocdb.c,v 1.230 2016/09/02 14:03:30 schwarze Exp $ */
+/*     $Id: mandocdb.c,v 1.262 2018/12/30 00:49:55 schwarze Exp $ */
 /*
  * Copyright (c) 2011, 2012 Kristaps Dzonsons <kristaps@bsd.lv>
- * Copyright (c) 2011-2016 Ingo Schwarze <schwarze@openbsd.org>
+ * Copyright (c) 2011-2018 Ingo Schwarze <schwarze@openbsd.org>
+ * Copyright (c) 2016 Ed Maste <emaste@freebsd.org>
  *
  * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above
@@ -18,8 +19,8 @@
 #include "config.h"
 
 #include <sys/types.h>
+#include <sys/mman.h>
 #include <sys/stat.h>
-#include <sys/wait.h>
 
 #include <assert.h>
 #include <ctype.h>
@@ -51,6 +52,7 @@
 #include "roff.h"
 #include "mdoc.h"
 #include "man.h"
+#include "mandoc_parse.h"
 #include "manconf.h"
 #include "mansearch.h"
 #include "dba_array.h"
@@ -84,6 +86,7 @@ struct        mpage {
        char            *arch;    /* architecture from file content */
        char            *title;   /* title from file content */
        char            *desc;    /* description from file content */
+       struct mpage    *next;    /* singly linked list */
        struct mlink    *mlinks;  /* singly linked list */
        int              name_head_done;
        enum form        form;    /* format from file content */
@@ -108,6 +111,7 @@ typedef     int (*mdoc_fp)(struct mpage *, const struct roff_meta *,
 struct mdoc_handler {
        mdoc_fp          fp; /* optional handler */
        uint64_t         mask;  /* set unless handler returns 0 */
+       int              taboo;  /* node flags that must not be set */
 };
 
 
@@ -118,11 +122,15 @@ static    void     dbadd_mlink(const struct mlink *mlink);
 static void     dbprune(struct dba *);
 static void     dbwrite(struct dba *);
 static void     filescan(const char *);
+#if HAVE_FTS_COMPARE_CONST
+static int      fts_compare(const FTSENT *const *, const FTSENT *const *);
+#else
+static int      fts_compare(const FTSENT **, const FTSENT **);
+#endif
 static void     mlink_add(struct mlink *, const struct stat *);
 static void     mlink_check(struct mpage *, struct mlink *);
 static void     mlink_free(struct mlink *);
 static void     mlinks_undupe(struct mpage *);
-int             mpages_compare(const void *, const void *);
 static void     mpages_free(void);
 static void     mpages_merge(struct dba *, struct mparse *);
 static void     parse_cat(struct mpage *, int);
@@ -132,6 +140,8 @@ static      void     parse_mdoc(struct mpage *, const struct roff_meta *,
                        const struct roff_node *);
 static int      parse_mdoc_head(struct mpage *, const struct roff_meta *,
                        const struct roff_node *);
+static int      parse_mdoc_Fa(struct mpage *, const struct roff_meta *,
+                       const struct roff_node *);
 static int      parse_mdoc_Fd(struct mpage *, const struct roff_meta *,
                        const struct roff_node *);
 static void     parse_mdoc_fname(struct mpage *, const struct roff_node *);
@@ -152,10 +162,10 @@ static    int      parse_mdoc_Xr(struct mpage *, const struct roff_meta *,
 static void     putkey(const struct mpage *, char *, uint64_t);
 static void     putkeys(const struct mpage *, char *, size_t, uint64_t);
 static void     putmdockey(const struct mpage *,
-                       const struct roff_node *, uint64_t);
+                       const struct roff_node *, uint64_t, int);
 static int      render_string(char **, size_t *);
 static void     say(const char *, const char *, ...)
-                       __attribute__((__format__ (printf, 2, 3)));
+                       __attribute__((__format__ (__printf__, 2, 3)));
 static int      set_basedir(const char *, int);
 static int      treescan(void);
 static size_t   utf8(unsigned int, char [7]);
@@ -169,136 +179,134 @@ static  int              write_utf8; /* write UTF-8 output; else ASCII */
 static int              exitcode; /* to be returned by main */
 static enum op          op; /* operational mode */
 static char             basedir[PATH_MAX]; /* current base directory */
+static struct mpage    *mpage_head; /* list of distinct manual pages */
 static struct ohash     mpages; /* table of distinct manual pages */
 static struct ohash     mlinks; /* table of directory entries */
 static struct ohash     names; /* table of all names */
 static struct ohash     strings; /* table of all strings */
 static uint64_t         name_mask;
 
-static const struct mdoc_handler mdocs[MDOC_MAX] = {
-       { NULL, 0 },  /* Ap */
-       { NULL, 0 },  /* Dd */
-       { NULL, 0 },  /* Dt */
-       { NULL, 0 },  /* Os */
-       { parse_mdoc_Sh, TYPE_Sh }, /* Sh */
-       { parse_mdoc_head, TYPE_Ss }, /* Ss */
-       { NULL, 0 },  /* Pp */
-       { NULL, 0 },  /* D1 */
-       { NULL, 0 },  /* Dl */
-       { NULL, 0 },  /* Bd */
-       { NULL, 0 },  /* Ed */
-       { NULL, 0 },  /* Bl */
-       { NULL, 0 },  /* El */
-       { NULL, 0 },  /* It */
-       { NULL, 0 },  /* Ad */
-       { NULL, TYPE_An },  /* An */
-       { NULL, TYPE_Ar },  /* Ar */
-       { NULL, TYPE_Cd },  /* Cd */
-       { NULL, TYPE_Cm },  /* Cm */
-       { NULL, TYPE_Dv },  /* Dv */
-       { NULL, TYPE_Er },  /* Er */
-       { NULL, TYPE_Ev },  /* Ev */
-       { NULL, 0 },  /* Ex */
-       { NULL, TYPE_Fa },  /* Fa */
-       { parse_mdoc_Fd, 0 },  /* Fd */
-       { NULL, TYPE_Fl },  /* Fl */
-       { parse_mdoc_Fn, 0 },  /* Fn */
-       { NULL, TYPE_Ft },  /* Ft */
-       { NULL, TYPE_Ic },  /* Ic */
-       { NULL, TYPE_In },  /* In */
-       { NULL, TYPE_Li },  /* Li */
-       { parse_mdoc_Nd, 0 },  /* Nd */
-       { parse_mdoc_Nm, 0 },  /* Nm */
-       { NULL, 0 },  /* Op */
-       { NULL, 0 },  /* Ot */
-       { NULL, TYPE_Pa },  /* Pa */
-       { NULL, 0 },  /* Rv */
-       { NULL, TYPE_St },  /* St */
-       { parse_mdoc_Va, TYPE_Va },  /* Va */
-       { parse_mdoc_Va, TYPE_Vt },  /* Vt */
-       { parse_mdoc_Xr, 0 },  /* Xr */
-       { NULL, 0 },  /* %A */
-       { NULL, 0 },  /* %B */
-       { NULL, 0 },  /* %D */
-       { NULL, 0 },  /* %I */
-       { NULL, 0 },  /* %J */
-       { NULL, 0 },  /* %N */
-       { NULL, 0 },  /* %O */
-       { NULL, 0 },  /* %P */
-       { NULL, 0 },  /* %R */
-       { NULL, 0 },  /* %T */
-       { NULL, 0 },  /* %V */
-       { NULL, 0 },  /* Ac */
-       { NULL, 0 },  /* Ao */
-       { NULL, 0 },  /* Aq */
-       { NULL, TYPE_At },  /* At */
-       { NULL, 0 },  /* Bc */
-       { NULL, 0 },  /* Bf */
-       { NULL, 0 },  /* Bo */
-       { NULL, 0 },  /* Bq */
-       { NULL, TYPE_Bsx },  /* Bsx */
-       { NULL, TYPE_Bx },  /* Bx */
-       { NULL, 0 },  /* Db */
-       { NULL, 0 },  /* Dc */
-       { NULL, 0 },  /* Do */
-       { NULL, 0 },  /* Dq */
-       { NULL, 0 },  /* Ec */
-       { NULL, 0 },  /* Ef */
-       { NULL, TYPE_Em },  /* Em */
-       { NULL, 0 },  /* Eo */
-       { NULL, TYPE_Fx },  /* Fx */
-       { NULL, TYPE_Ms },  /* Ms */
-       { NULL, 0 },  /* No */
-       { NULL, 0 },  /* Ns */
-       { NULL, TYPE_Nx },  /* Nx */
-       { NULL, TYPE_Ox },  /* Ox */
-       { NULL, 0 },  /* Pc */
-       { NULL, 0 },  /* Pf */
-       { NULL, 0 },  /* Po */
-       { NULL, 0 },  /* Pq */
-       { NULL, 0 },  /* Qc */
-       { NULL, 0 },  /* Ql */
-       { NULL, 0 },  /* Qo */
-       { NULL, 0 },  /* Qq */
-       { NULL, 0 },  /* Re */
-       { NULL, 0 },  /* Rs */
-       { NULL, 0 },  /* Sc */
-       { NULL, 0 },  /* So */
-       { NULL, 0 },  /* Sq */
-       { NULL, 0 },  /* Sm */
-       { NULL, 0 },  /* Sx */
-       { NULL, TYPE_Sy },  /* Sy */
-       { NULL, TYPE_Tn },  /* Tn */
-       { NULL, 0 },  /* Ux */
-       { NULL, 0 },  /* Xc */
-       { NULL, 0 },  /* Xo */
-       { parse_mdoc_Fo, 0 },  /* Fo */
-       { NULL, 0 },  /* Fc */
-       { NULL, 0 },  /* Oo */
-       { NULL, 0 },  /* Oc */
-       { NULL, 0 },  /* Bk */
-       { NULL, 0 },  /* Ek */
-       { NULL, 0 },  /* Bt */
-       { NULL, 0 },  /* Hf */
-       { NULL, 0 },  /* Fr */
-       { NULL, 0 },  /* Ud */
-       { NULL, TYPE_Lb },  /* Lb */
-       { NULL, 0 },  /* Lp */
-       { NULL, TYPE_Lk },  /* Lk */
-       { NULL, TYPE_Mt },  /* Mt */
-       { NULL, 0 },  /* Brq */
-       { NULL, 0 },  /* Bro */
-       { NULL, 0 },  /* Brc */
-       { NULL, 0 },  /* %C */
-       { NULL, 0 },  /* Es */
-       { NULL, 0 },  /* En */
-       { NULL, TYPE_Dx },  /* Dx */
-       { NULL, 0 },  /* %Q */
-       { NULL, 0 },  /* br */
-       { NULL, 0 },  /* sp */
-       { NULL, 0 },  /* %U */
-       { NULL, 0 },  /* Ta */
-       { NULL, 0 },  /* ll */
+static const struct mdoc_handler mdoc_handlers[MDOC_MAX - MDOC_Dd] = {
+       { NULL, 0, NODE_NOPRT },  /* Dd */
+       { NULL, 0, NODE_NOPRT },  /* Dt */
+       { NULL, 0, NODE_NOPRT },  /* Os */
+       { parse_mdoc_Sh, TYPE_Sh, 0 }, /* Sh */
+       { parse_mdoc_head, TYPE_Ss, 0 }, /* Ss */
+       { NULL, 0, 0 },  /* Pp */
+       { NULL, 0, 0 },  /* D1 */
+       { NULL, 0, 0 },  /* Dl */
+       { NULL, 0, 0 },  /* Bd */
+       { NULL, 0, 0 },  /* Ed */
+       { NULL, 0, 0 },  /* Bl */
+       { NULL, 0, 0 },  /* El */
+       { NULL, 0, 0 },  /* It */
+       { NULL, 0, 0 },  /* Ad */
+       { NULL, TYPE_An, 0 },  /* An */
+       { NULL, 0, 0 },  /* Ap */
+       { NULL, TYPE_Ar, 0 },  /* Ar */
+       { NULL, TYPE_Cd, 0 },  /* Cd */
+       { NULL, TYPE_Cm, 0 },  /* Cm */
+       { NULL, TYPE_Dv, 0 },  /* Dv */
+       { NULL, TYPE_Er, 0 },  /* Er */
+       { NULL, TYPE_Ev, 0 },  /* Ev */
+       { NULL, 0, 0 },  /* Ex */
+       { parse_mdoc_Fa, 0, 0 },  /* Fa */
+       { parse_mdoc_Fd, 0, 0 },  /* Fd */
+       { NULL, TYPE_Fl, 0 },  /* Fl */
+       { parse_mdoc_Fn, 0, 0 },  /* Fn */
+       { NULL, TYPE_Ft | TYPE_Vt, 0 },  /* Ft */
+       { NULL, TYPE_Ic, 0 },  /* Ic */
+       { NULL, TYPE_In, 0 },  /* In */
+       { NULL, TYPE_Li, 0 },  /* Li */
+       { parse_mdoc_Nd, 0, 0 },  /* Nd */
+       { parse_mdoc_Nm, 0, 0 },  /* Nm */
+       { NULL, 0, 0 },  /* Op */
+       { NULL, 0, 0 },  /* Ot */
+       { NULL, TYPE_Pa, NODE_NOSRC },  /* Pa */
+       { NULL, 0, 0 },  /* Rv */
+       { NULL, TYPE_St, 0 },  /* St */
+       { parse_mdoc_Va, TYPE_Va, 0 },  /* Va */
+       { parse_mdoc_Va, TYPE_Vt, 0 },  /* Vt */
+       { parse_mdoc_Xr, 0, 0 },  /* Xr */
+       { NULL, 0, 0 },  /* %A */
+       { NULL, 0, 0 },  /* %B */
+       { NULL, 0, 0 },  /* %D */
+       { NULL, 0, 0 },  /* %I */
+       { NULL, 0, 0 },  /* %J */
+       { NULL, 0, 0 },  /* %N */
+       { NULL, 0, 0 },  /* %O */
+       { NULL, 0, 0 },  /* %P */
+       { NULL, 0, 0 },  /* %R */
+       { NULL, 0, 0 },  /* %T */
+       { NULL, 0, 0 },  /* %V */
+       { NULL, 0, 0 },  /* Ac */
+       { NULL, 0, 0 },  /* Ao */
+       { NULL, 0, 0 },  /* Aq */
+       { NULL, TYPE_At, 0 },  /* At */
+       { NULL, 0, 0 },  /* Bc */
+       { NULL, 0, 0 },  /* Bf */
+       { NULL, 0, 0 },  /* Bo */
+       { NULL, 0, 0 },  /* Bq */
+       { NULL, TYPE_Bsx, NODE_NOSRC },  /* Bsx */
+       { NULL, TYPE_Bx, NODE_NOSRC },  /* Bx */
+       { NULL, 0, 0 },  /* Db */
+       { NULL, 0, 0 },  /* Dc */
+       { NULL, 0, 0 },  /* Do */
+       { NULL, 0, 0 },  /* Dq */
+       { NULL, 0, 0 },  /* Ec */
+       { NULL, 0, 0 },  /* Ef */
+       { NULL, TYPE_Em, 0 },  /* Em */
+       { NULL, 0, 0 },  /* Eo */
+       { NULL, TYPE_Fx, NODE_NOSRC },  /* Fx */
+       { NULL, TYPE_Ms, 0 },  /* Ms */
+       { NULL, 0, 0 },  /* No */
+       { NULL, 0, 0 },  /* Ns */
+       { NULL, TYPE_Nx, NODE_NOSRC },  /* Nx */
+       { NULL, TYPE_Ox, NODE_NOSRC },  /* Ox */
+       { NULL, 0, 0 },  /* Pc */
+       { NULL, 0, 0 },  /* Pf */
+       { NULL, 0, 0 },  /* Po */
+       { NULL, 0, 0 },  /* Pq */
+       { NULL, 0, 0 },  /* Qc */
+       { NULL, 0, 0 },  /* Ql */
+       { NULL, 0, 0 },  /* Qo */
+       { NULL, 0, 0 },  /* Qq */
+       { NULL, 0, 0 },  /* Re */
+       { NULL, 0, 0 },  /* Rs */
+       { NULL, 0, 0 },  /* Sc */
+       { NULL, 0, 0 },  /* So */
+       { NULL, 0, 0 },  /* Sq */
+       { NULL, 0, 0 },  /* Sm */
+       { NULL, 0, 0 },  /* Sx */
+       { NULL, TYPE_Sy, 0 },  /* Sy */
+       { NULL, TYPE_Tn, 0 },  /* Tn */
+       { NULL, 0, NODE_NOSRC },  /* Ux */
+       { NULL, 0, 0 },  /* Xc */
+       { NULL, 0, 0 },  /* Xo */
+       { parse_mdoc_Fo, 0, 0 },  /* Fo */
+       { NULL, 0, 0 },  /* Fc */
+       { NULL, 0, 0 },  /* Oo */
+       { NULL, 0, 0 },  /* Oc */
+       { NULL, 0, 0 },  /* Bk */
+       { NULL, 0, 0 },  /* Ek */
+       { NULL, 0, 0 },  /* Bt */
+       { NULL, 0, 0 },  /* Hf */
+       { NULL, 0, 0 },  /* Fr */
+       { NULL, 0, 0 },  /* Ud */
+       { NULL, TYPE_Lb, NODE_NOSRC },  /* Lb */
+       { NULL, 0, 0 },  /* Lp */
+       { NULL, TYPE_Lk, 0 },  /* Lk */
+       { NULL, TYPE_Mt, NODE_NOSRC },  /* Mt */
+       { NULL, 0, 0 },  /* Brq */
+       { NULL, 0, 0 },  /* Bro */
+       { NULL, 0, 0 },  /* Brc */
+       { NULL, 0, 0 },  /* %C */
+       { NULL, 0, 0 },  /* Es */
+       { NULL, 0, 0 },  /* En */
+       { NULL, TYPE_Dx, NODE_NOSRC },  /* Dx */
+       { NULL, 0, 0 },  /* %Q */
+       { NULL, 0, 0 },  /* %U */
+       { NULL, 0, 0 },  /* Ta */
 };
 
 
@@ -313,7 +321,7 @@ mandocdb(int argc, char *argv[])
        int               ch, i;
 
 #if HAVE_PLEDGE
-       if (pledge("stdio rpath wpath cpath fattr flock proc exec", NULL) == -1) {
+       if (pledge("stdio rpath wpath cpath", NULL) == -1) {
                warn("pledge");
                return (int)MANDOCLEVEL_SYSERR;
        }
@@ -339,6 +347,7 @@ mandocdb(int argc, char *argv[])
                goto usage; \
        } while (/*CONSTCOND*/0)
 
+       mparse_options = MPARSE_VALIDATE;
        path_arg = NULL;
        op = OP_DEFAULT;
 
@@ -414,7 +423,7 @@ mandocdb(int argc, char *argv[])
 
        exitcode = (int)MANDOCLEVEL_OK;
        mchars_alloc();
-       mp = mparse_alloc(mparse_options, MANDOCLEVEL_BADARG, NULL, NULL);
+       mp = mparse_alloc(mparse_options, MANDOC_OS_OTHER, NULL);
        mandoc_ohash_init(&mpages, 6, offsetof(struct mpage, inodev));
        mandoc_ohash_init(&mlinks, 6, offsetof(struct mlink, file));
 
@@ -433,15 +442,6 @@ mandocdb(int argc, char *argv[])
                         * The existing database is usable.  Process
                         * all files specified on the command-line.
                         */
-#if HAVE_PLEDGE
-                       if (!nodb) {
-                               if (pledge("stdio rpath wpath cpath fattr flock", NULL) == -1) {
-                                       warn("pledge");
-                                       exitcode = (int)MANDOCLEVEL_SYSERR;
-                                       goto out;
-                               }
-                       }
-#endif
                        use_all = 1;
                        for (i = 0; i < argc; i++)
                                filescan(argv[i]);
@@ -539,6 +539,20 @@ usage:
        return (int)MANDOCLEVEL_BADARG;
 }
 
+/*
+ * To get a singly linked list in alpha order while inserting entries
+ * at the beginning, process directory entries in reverse alpha order.
+ */
+static int
+#if HAVE_FTS_COMPARE_CONST
+fts_compare(const FTSENT *const *a, const FTSENT *const *b)
+#else
+fts_compare(const FTSENT **a, const FTSENT **b)
+#endif
+{
+       return -strcmp((*a)->fts_name, (*b)->fts_name);
+}
+
 /*
  * Scan a directory tree rooted at "basedir" for manpages.
  * We use fts(), scanning directory parts along the way for clues to our
@@ -567,10 +581,10 @@ treescan(void)
        const char      *argv[2];
 
        argv[0] = ".";
-       argv[1] = (char *)NULL;
+       argv[1] = NULL;
 
-       f = fts_open((char * const *)argv,
-           FTS_PHYSICAL | FTS_NOCHDIR, NULL);
+       f = fts_open((char * const *)argv, FTS_PHYSICAL | FTS_NOCHDIR,
+           fts_compare);
        if (f == NULL) {
                exitcode = (int)MANDOCLEVEL_SYSERR;
                say("", "&fts_open");
@@ -849,6 +863,20 @@ filescan(const char *file)
                return;
        }
 
+       /*
+        * In test mode or when the original name is absolute
+        * but outside our tree, guess the base directory.
+        */
+
+       if (op == OP_TEST || (start == buf && *start == '/')) {
+               if (strncmp(buf, "man/", 4) == 0)
+                       start = buf + 4;
+               else if ((start = strstr(buf, "/man/")) != NULL)
+                       start += 5;
+               else
+                       start = buf;
+       }
+
        /*
         * First try to guess our directory structure.
         * If we find a separator, try to look for man* or cat*.
@@ -936,6 +964,8 @@ mlink_add(struct mlink *mlink, const struct stat *st)
                mpage->inodev.st_ino = inodev.st_ino;
                mpage->inodev.st_dev = inodev.st_dev;
                mpage->form = FORM_NONE;
+               mpage->next = mpage_head;
+               mpage_head = mpage;
                ohash_insert(&mpages, slot, mpage);
        } else
                mlink->next = mpage->mlinks;
@@ -959,20 +989,18 @@ mpages_free(void)
 {
        struct mpage    *mpage;
        struct mlink    *mlink;
-       unsigned int     slot;
 
-       mpage = ohash_first(&mpages, &slot);
-       while (NULL != mpage) {
-               while (NULL != (mlink = mpage->mlinks)) {
+       while ((mpage = mpage_head) != NULL) {
+               while ((mlink = mpage->mlinks) != NULL) {
                        mpage->mlinks = mlink->next;
                        mlink_free(mlink);
                }
+               mpage_head = mpage->next;
                free(mpage->sec);
                free(mpage->arch);
                free(mpage->title);
                free(mpage->desc);
                free(mpage);
-               mpage = ohash_next(&mpages, &slot);
        }
 }
 
@@ -1086,36 +1114,22 @@ mlink_check(struct mpage *mpage, struct mlink *mlink)
 static void
 mpages_merge(struct dba *dba, struct mparse *mp)
 {
-       struct mpage            **mplist, *mpage, *mpage_dest;
+       struct mpage            *mpage, *mpage_dest;
        struct mlink            *mlink, *mlink_dest;
-       struct roff_man         *man;
-       char                    *sodest;
+       struct roff_meta        *meta;
        char                    *cp;
        int                      fd;
-       unsigned int             ip, npages, pslot;
 
-       npages = ohash_entries(&mpages);
-       mplist = mandoc_reallocarray(NULL, npages, sizeof(*mplist));
-       ip = 0;
-       mpage = ohash_first(&mpages, &pslot);
-       while (mpage != NULL) {
+       for (mpage = mpage_head; mpage != NULL; mpage = mpage->next) {
                mlinks_undupe(mpage);
-               if (mpage->mlinks != NULL)
-                       mplist[ip++] = mpage;
-               mpage = ohash_next(&mpages, &pslot);
-       }
-       npages = ip;
-       qsort(mplist, npages, sizeof(*mplist), mpages_compare);
+               if ((mlink = mpage->mlinks) == NULL)
+                       continue;
 
-       for (ip = 0; ip < npages; ip++) {
-               mpage = mplist[ip];
-               mlink = mpage->mlinks;
                name_mask = NAME_MASK;
                mandoc_ohash_init(&names, 4, offsetof(struct str, key));
                mandoc_ohash_init(&strings, 6, offsetof(struct str, key));
                mparse_reset(mp);
-               man = NULL;
-               sodest = NULL;
+               meta = NULL;
 
                if ((fd = mparse_open(mp, mlink->file)) == -1) {
                        say(mlink->file, "&open");
@@ -1129,14 +1143,15 @@ mpages_merge(struct dba *dba, struct mparse *mp)
                if (mlink->dform != FORM_CAT || mlink->fform != FORM_CAT) {
                        mparse_readfd(mp, fd, mlink->file);
                        close(fd);
-                       mparse_result(mp, &man, &sodest);
+                       fd = -1;
+                       meta = mparse_result(mp);
                }
 
-               if (sodest != NULL) {
+               if (meta != NULL && meta->sodest != NULL) {
                        mlink_dest = ohash_find(&mlinks,
-                           ohash_qlookup(&mlinks, sodest));
+                           ohash_qlookup(&mlinks, meta->sodest));
                        if (mlink_dest == NULL) {
-                               mandoc_asprintf(&cp, "%s.gz", sodest);
+                               mandoc_asprintf(&cp, "%s.gz", meta->sodest);
                                mlink_dest = ohash_find(&mlinks,
                                    ohash_qlookup(&mlinks, cp));
                                free(cp);
@@ -1173,91 +1188,105 @@ mpages_merge(struct dba *dba, struct mparse *mp)
                                mpage->mlinks = NULL;
                        }
                        goto nextpage;
-               } else if (man != NULL && man->macroset == MACROSET_MDOC) {
-                       mdoc_validate(man);
+               } else if (meta != NULL && meta->macroset == MACROSET_MDOC) {
                        mpage->form = FORM_SRC;
-                       mpage->sec = man->meta.msec;
+                       mpage->sec = meta->msec;
                        mpage->sec = mandoc_strdup(
                            mpage->sec == NULL ? "" : mpage->sec);
-                       mpage->arch = man->meta.arch;
+                       mpage->arch = meta->arch;
                        mpage->arch = mandoc_strdup(
                            mpage->arch == NULL ? "" : mpage->arch);
-                       mpage->title = mandoc_strdup(man->meta.title);
-               } else if (man != NULL && man->macroset == MACROSET_MAN) {
-                       man_validate(man);
-                       mpage->form = FORM_SRC;
-                       mpage->sec = mandoc_strdup(man->meta.msec);
-                       mpage->arch = mandoc_strdup(mlink->arch);
-                       mpage->title = mandoc_strdup(man->meta.title);
-               } else {
+                       mpage->title = mandoc_strdup(meta->title);
+               } else if (meta != NULL && meta->macroset == MACROSET_MAN) {
+                       if (*meta->msec != '\0' || *meta->title != '\0') {
+                               mpage->form = FORM_SRC;
+                               mpage->sec = mandoc_strdup(meta->msec);
+                               mpage->arch = mandoc_strdup(mlink->arch);
+                               mpage->title = mandoc_strdup(meta->title);
+                       } else
+                               meta = NULL;
+               }
+
+               assert(mpage->desc == NULL);
+               if (meta == NULL) {
                        mpage->form = FORM_CAT;
                        mpage->sec = mandoc_strdup(mlink->dsec);
                        mpage->arch = mandoc_strdup(mlink->arch);
                        mpage->title = mandoc_strdup(mlink->name);
-               }
-
-               assert(mpage->desc == NULL);
-               if (man != NULL && man->macroset == MACROSET_MDOC)
-                       parse_mdoc(mpage, &man->meta, man->first);
-               else if (man != NULL)
-                       parse_man(mpage, &man->meta, man->first);
-               else
                        parse_cat(mpage, fd);
-               if (mpage->desc == NULL)
-                       mpage->desc = mandoc_strdup(mpage->mlinks->name);
+               } else if (meta->macroset == MACROSET_MDOC)
+                       parse_mdoc(mpage, meta, meta->first);
+               else
+                       parse_man(mpage, meta, meta->first);
+               if (mpage->desc == NULL) {
+                       mpage->desc = mandoc_strdup(mlink->name);
+                       if (warnings)
+                               say(mlink->file, "No one-line description, "
+                                   "using filename \"%s\"", mlink->name);
+               }
 
-               if (warnings && !use_all)
-                       for (mlink = mpage->mlinks; mlink;
-                            mlink = mlink->next)
+               for (mlink = mpage->mlinks;
+                    mlink != NULL;
+                    mlink = mlink->next) {
+                       putkey(mpage, mlink->name, NAME_FILE);
+                       if (warnings && !use_all)
                                mlink_check(mpage, mlink);
+               }
 
                dbadd(dba, mpage);
-               mlink = mpage->mlinks;
 
 nextpage:
                ohash_delete(&strings);
                ohash_delete(&names);
        }
-       free(mplist);
-}
-
-int
-mpages_compare(const void *vp1, const void *vp2)
-{
-       const struct mpage      *mp1, *mp2;
-
-       mp1 = *(const struct mpage **)vp1;
-       mp2 = *(const struct mpage **)vp2;
-       return strcmp(mp1->mlinks->file, mp2->mlinks->file);
 }
 
 static void
 parse_cat(struct mpage *mpage, int fd)
 {
        FILE            *stream;
-       char            *line, *p, *title;
+       struct mlink    *mlink;
+       char            *line, *p, *title, *sec;
        size_t           linesz, plen, titlesz;
        ssize_t          len;
        int              offs;
 
-       stream = (-1 == fd) ?
-           fopen(mpage->mlinks->file, "r") :
-           fdopen(fd, "r");
-       if (NULL == stream) {
-               if (-1 != fd)
+       mlink = mpage->mlinks;
+       stream = fd == -1 ? fopen(mlink->file, "r") : fdopen(fd, "r");
+       if (stream == NULL) {
+               if (fd != -1)
                        close(fd);
                if (warnings)
-                       say(mpage->mlinks->file, "&fopen");
+                       say(mlink->file, "&fopen");
                return;
        }
 
        line = NULL;
        linesz = 0;
 
-       /* Skip to first blank line. */
+       /* Parse the section number from the header line. */
 
-       while (getline(&line, &linesz, stream) != -1)
+       while (getline(&line, &linesz, stream) != -1) {
                if (*line == '\n')
+                       continue;
+               if ((sec = strchr(line, '(')) == NULL)
+                       break;
+               if ((p = strchr(++sec, ')')) == NULL)
+                       break;
+               free(mpage->sec);
+               mpage->sec = mandoc_strndup(sec, p - sec);
+               if (warnings && *mlink->dsec != '\0' &&
+                   strcasecmp(mpage->sec, mlink->dsec))
+                       say(mlink->file,
+                           "Section \"%s\" manual in %s directory",
+                           mpage->sec, mlink->dsec);
+               break;
+       }
+
+       /* Skip to first blank line. */
+
+       while (line == NULL || *line != '\n')
+               if (getline(&line, &linesz, stream) == -1)
                        break;
 
        /*
@@ -1303,8 +1332,7 @@ parse_cat(struct mpage *mpage, int fd)
 
        if (NULL == title || '\0' == *title) {
                if (warnings)
-                       say(mpage->mlinks->file,
-                           "Cannot find NAME section");
+                       say(mlink->file, "Cannot find NAME section");
                fclose(stream);
                free(title);
                return;
@@ -1323,8 +1351,8 @@ parse_cat(struct mpage *mpage, int fd)
                        /* Skip to next word. */ ;
        } else {
                if (warnings)
-                       say(mpage->mlinks->file,
-                           "No dash in title line");
+                       say(mlink->file, "No dash in title line, "
+                           "reusing \"%s\" as one-line description", title);
                p = title;
        }
 
@@ -1342,7 +1370,12 @@ parse_cat(struct mpage *mpage, int fd)
                plen -= 2;
        }
 
-       mpage->desc = mandoc_strdup(p);
+       /*
+        * Cut off excessive one-line descriptions.
+        * Bad pages are not worth better heuristics.
+        */
+
+       mpage->desc = mandoc_strndup(p, 150);
        fclose(stream);
        free(title);
 }
@@ -1361,12 +1394,14 @@ putkey(const struct mpage *mpage, char *value, uint64_t type)
  */
 static void
 putmdockey(const struct mpage *mpage,
-       const struct roff_node *n, uint64_t m)
+       const struct roff_node *n, uint64_t m, int taboo)
 {
 
        for ( ; NULL != n; n = n->next) {
+               if (n->flags & taboo)
+                       continue;
                if (NULL != n->child)
-                       putmdockey(mpage, n->child, m);
+                       putmdockey(mpage, n->child, m, taboo);
                if (n->type == ROFFT_TEXT)
                        putkey(mpage, n->string, m);
        }
@@ -1484,7 +1519,12 @@ parse_man(struct mpage *mpage, const struct roff_meta *meta,
                        while (' ' == *start)
                                start++;
 
-                       mpage->desc = mandoc_strdup(start);
+                       /*
+                        * Cut off excessive one-line descriptions.
+                        * Bad pages are not worth better heuristics.
+                        */
+
+                       mpage->desc = mandoc_strndup(start, 150);
                        free(title);
                        return;
                }
@@ -1501,24 +1541,30 @@ static void
 parse_mdoc(struct mpage *mpage, const struct roff_meta *meta,
        const struct roff_node *n)
 {
+       const struct mdoc_handler *handler;
+
+       for (n = n->child; n != NULL; n = n->next) {
+               if (n->tok == TOKEN_NONE || n->tok < ROFF_MAX)
+                       continue;
+               assert(n->tok >= MDOC_Dd && n->tok < MDOC_MAX);
+               handler = mdoc_handlers + (n->tok - MDOC_Dd);
+               if (n->flags & handler->taboo)
+                       continue;
 
-       assert(NULL != n);
-       for (n = n->child; NULL != n; n = n->next) {
                switch (n->type) {
                case ROFFT_ELEM:
                case ROFFT_BLOCK:
                case ROFFT_HEAD:
                case ROFFT_BODY:
                case ROFFT_TAIL:
-                       if (NULL != mdocs[n->tok].fp)
-                              if (0 == (*mdocs[n->tok].fp)(mpage, meta, n))
-                                      break;
-                       if (mdocs[n->tok].mask)
+                       if (handler->fp != NULL &&
+                           (*handler->fp)(mpage, meta, n) == 0)
+                               break;
+                       if (handler->mask)
                                putmdockey(mpage, n->child,
-                                   mdocs[n->tok].mask);
+                                   handler->mask, handler->taboo);
                        break;
                default:
-                       assert(n->type != ROFFT_ROOT);
                        continue;
                }
                if (NULL != n->child)
@@ -1526,6 +1572,20 @@ parse_mdoc(struct mpage *mpage, const struct roff_meta *meta,
        }
 }
 
+static int
+parse_mdoc_Fa(struct mpage *mpage, const struct roff_meta *meta,
+       const struct roff_node *n)
+{
+       uint64_t mask;
+
+       mask = TYPE_Fa;
+       if (n->sec == SEC_SYNOPSIS)
+               mask |= TYPE_Vt;
+
+       putmdockey(mpage, n->child, mask, 0);
+       return 0;
+}
+
 static int
 parse_mdoc_Fd(struct mpage *mpage, const struct roff_meta *meta,
        const struct roff_node *n)
@@ -1595,15 +1655,20 @@ static int
 parse_mdoc_Fn(struct mpage *mpage, const struct roff_meta *meta,
        const struct roff_node *n)
 {
+       uint64_t mask;
 
        if (n->child == NULL)
                return 0;
 
        parse_mdoc_fname(mpage, n->child);
 
-       for (n = n->child->next; n != NULL; n = n->next)
-               if (n->type == ROFFT_TEXT)
-                       putkey(mpage, n->string, TYPE_Fa);
+       n = n->child->next;
+       if (n != NULL && n->type == ROFFT_TEXT) {
+               mask = TYPE_Fa;
+               if (n->sec == SEC_SYNOPSIS)
+                       mask |= TYPE_Vt;
+               putmdockey(mpage, n, mask, 0);
+       }
 
        return 0;
 }
@@ -1683,12 +1748,12 @@ parse_mdoc_Nm(struct mpage *mpage, const struct roff_meta *meta,
 {
 
        if (SEC_NAME == n->sec)
-               putmdockey(mpage, n->child, NAME_TITLE);
+               putmdockey(mpage, n->child, NAME_TITLE, 0);
        else if (n->sec == SEC_SYNOPSIS && n->type == ROFFT_HEAD) {
                if (n->child == NULL)
                        putkey(mpage, meta->name, NAME_SYN);
                else
-                       putmdockey(mpage, n->child, NAME_SYN);
+                       putmdockey(mpage, n->child, NAME_SYN, 0);
        }
        if ( ! (mpage->name_head_done ||
            n->child == NULL || n->child->string == NULL ||
@@ -1741,7 +1806,8 @@ putkeys(const struct mpage *mpage, char *cp, size_t sz, uint64_t v)
                        name_mask &= ~NAME_FIRST;
                if (debug > 1)
                        say(mpage->mlinks->file,
-                           "Adding name %*s, bits=0x%llu", (int)sz, cp, v);
+                           "Adding name %*s, bits=0x%llx", (int)sz, cp,
+                           (unsigned long long)v);
        } else {
                htab = &strings;
                if (debug > 1)
@@ -2073,9 +2139,27 @@ dbprune(struct dba *dba)
 static void
 dbwrite(struct dba *dba)
 {
-       char             tfn[32];
-       int              status;
-       pid_t            child;
+       struct stat      sb1, sb2;
+       char             tfn[33], *cp1, *cp2;
+       off_t            i;
+       int              fd1, fd2;
+
+       /*
+        * Do not write empty databases, and delete existing ones
+        * when makewhatis -u causes them to become empty.
+        */
+
+       dba_array_start(dba->pages);
+       if (dba_array_next(dba->pages) == NULL) {
+               if (unlink(MANDOC_DB) == -1 && errno != ENOENT)
+                       say(MANDOC_DB, "&unlink");
+               return;
+       }
+
+       /*
+        * Build the database in a temporary file,
+        * then atomically move it into place.
+        */
 
        if (dba_write(MANDOC_DB "~", dba) != -1) {
                if (rename(MANDOC_DB "~", MANDOC_DB) == -1) {
@@ -2086,65 +2170,73 @@ dbwrite(struct dba *dba)
                return;
        }
 
+       /*
+        * We lack write permission and cannot replace the database
+        * file, but let's at least check whether the data changed.
+        */
+
        (void)strlcpy(tfn, "/tmp/mandocdb.XXXXXXXX", sizeof(tfn));
        if (mkdtemp(tfn) == NULL) {
                exitcode = (int)MANDOCLEVEL_SYSERR;
                say("", "&%s", tfn);
                return;
        }
-
+       cp1 = cp2 = MAP_FAILED;
+       fd1 = fd2 = -1;
        (void)strlcat(tfn, "/" MANDOC_DB, sizeof(tfn));
        if (dba_write(tfn, dba) == -1) {
-               exitcode = (int)MANDOCLEVEL_SYSERR;
                say(tfn, "&dba_write");
-               goto out;
+               goto err;
        }
-
-       switch (child = fork()) {
-       case -1:
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say("", "&fork cmp");
-               return;
-       case 0:
-               execlp("cmp", "cmp", "-s", tfn, MANDOC_DB, (char *)NULL);
-               say("", "&exec cmp");
-               exit(0);
-       default:
-               break;
+       if ((fd1 = open(MANDOC_DB, O_RDONLY, 0)) == -1) {
+               say(MANDOC_DB, "&open");
+               goto err;
        }
-       if (waitpid(child, &status, 0) == -1) {
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say("", "&wait cmp");
-       } else if (WIFSIGNALED(status)) {
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say("", "cmp died from signal %d", WTERMSIG(status));
-       } else if (WEXITSTATUS(status)) {
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say(MANDOC_DB,
-                   "Data changed, but cannot replace database");
+       if ((fd2 = open(tfn, O_RDONLY, 0)) == -1) {
+               say(tfn, "&open");
+               goto err;
+       }
+       if (fstat(fd1, &sb1) == -1) {
+               say(MANDOC_DB, "&fstat");
+               goto err;
+       }
+       if (fstat(fd2, &sb2) == -1) {
+               say(tfn, "&fstat");
+               goto err;
        }
+       if (sb1.st_size != sb2.st_size)
+               goto err;
+       if ((cp1 = mmap(NULL, sb1.st_size, PROT_READ, MAP_PRIVATE,
+           fd1, 0)) == MAP_FAILED) {
+               say(MANDOC_DB, "&mmap");
+               goto err;
+       }
+       if ((cp2 = mmap(NULL, sb2.st_size, PROT_READ, MAP_PRIVATE,
+           fd2, 0)) == MAP_FAILED) {
+               say(tfn, "&mmap");
+               goto err;
+       }
+       for (i = 0; i < sb1.st_size; i++)
+               if (cp1[i] != cp2[i])
+                       goto err;
+       goto out;
+
+err:
+       exitcode = (int)MANDOCLEVEL_SYSERR;
+       say(MANDOC_DB, "Data changed, but cannot replace database");
 
 out:
+       if (cp1 != MAP_FAILED)
+               munmap(cp1, sb1.st_size);
+       if (cp2 != MAP_FAILED)
+               munmap(cp2, sb2.st_size);
+       if (fd1 != -1)
+               close(fd1);
+       if (fd2 != -1)
+               close(fd2);
+       unlink(tfn);
        *strrchr(tfn, '/') = '\0';
-       switch (child = fork()) {
-       case -1:
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say("", "&fork rm");
-               return;
-       case 0:
-               execlp("rm", "rm", "-rf", tfn, (char *)NULL);
-               say("", "&exec rm");
-               exit((int)MANDOCLEVEL_SYSERR);
-       default:
-               break;
-       }
-       if (waitpid(child, &status, 0) == -1) {
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say("", "&wait rm");
-       } else if (WIFSIGNALED(status) || WEXITSTATUS(status)) {
-               exitcode = (int)MANDOCLEVEL_SYSERR;
-               say("", "%s: Cannot remove temporary directory", tfn);
-       }
+       rmdir(tfn);
 }
 
 static int