]> git.cameronkatri.com Git - mandoc.git/blobdiff - mandocdb.c
Generalize the mparse_alloc() and roff_alloc() functions by giving
[mandoc.git] / mandocdb.c
index 467e8f86906256cd84b4cc0ccc3858d860d4a13e..48d3deb3d13643368e356b9cc6f53397103e5e4b 100644 (file)
@@ -1,4 +1,4 @@
-/*     $Id: mandocdb.c,v 1.111 2014/01/19 00:09:38 schwarze Exp $ */
+/*     $Id: mandocdb.c,v 1.116 2014/03/19 21:51:20 schwarze Exp $ */
 /*
  * Copyright (c) 2011, 2012 Kristaps Dzonsons <kristaps@bsd.lv>
  * Copyright (c) 2011, 2012, 2013, 2014 Ingo Schwarze <schwarze@openbsd.org>
@@ -20,6 +20,7 @@
 #endif
 
 #include <sys/stat.h>
+#include <sys/wait.h>
 
 #include <assert.h>
 #include <ctype.h>
@@ -157,8 +158,7 @@ static      int      parse_mdoc_Nd(struct mpage *, const struct mdoc_node *);
 static int      parse_mdoc_Nm(struct mpage *, const struct mdoc_node *);
 static int      parse_mdoc_Sh(struct mpage *, const struct mdoc_node *);
 static int      parse_mdoc_Xr(struct mpage *, const struct mdoc_node *);
-static void     putkey(const struct mpage *,
-                       const char *, uint64_t);
+static void     putkey(const struct mpage *, char *, uint64_t);
 static void     putkeys(const struct mpage *,
                        const char *, size_t, uint64_t);
 static void     putmdockey(const struct mpage *,
@@ -169,9 +169,10 @@ static     int      set_basedir(const char *);
 static int      treescan(void);
 static size_t   utf8(unsigned int, char [7]);
 
+static char             tempfilename[32];
 static char            *progname;
 static int              nodb; /* no database changes */
-static int              quick; /* abort the parse early */
+static int              mparse_options; /* abort the parse early */
 static int              use_all; /* use all found files */
 static int              verb; /* print what we're doing */
 static int              warnings; /* warn about crap */
@@ -350,6 +351,7 @@ main(int argc, char *argv[])
 
        path_arg = NULL;
        op = OP_DEFAULT;
+       mparse_options = MPARSE_SO;
 
        while (-1 != (ch = getopt(argc, argv, "aC:d:nQT:tu:vW")))
                switch (ch) {
@@ -370,7 +372,7 @@ main(int argc, char *argv[])
                        nodb = 1;
                        break;
                case ('Q'):
-                       quick = 1;
+                       mparse_options |= MPARSE_QUICK;
                        break;
                case ('T'):
                        if (strcmp(optarg, "utf8")) {
@@ -410,8 +412,7 @@ main(int argc, char *argv[])
        }
 
        exitcode = (int)MANDOCLEVEL_OK;
-       mp = mparse_alloc(MPARSE_AUTO, 
-               MANDOCLEVEL_FATAL, NULL, NULL, quick);
+       mp = mparse_alloc(mparse_options, MANDOCLEVEL_FATAL, NULL, NULL);
        mc = mchars_alloc();
 
        ohash_init(&mpages, 6, &mpages_info);
@@ -957,12 +958,13 @@ mlink_check(struct mpage *mpage, struct mlink *mlink)
 static void
 mpages_merge(struct mchars *mc, struct mparse *mp)
 {
+       char                     any[] = "any";
        struct ohash_info        str_info;
        struct mpage            *mpage;
        struct mlink            *mlink;
        struct mdoc             *mdoc;
        struct man              *man;
-       const char              *cp;
+       char                    *cp;
        int                      match;
        unsigned int             pslot;
        enum mandoclevel         lvl;
@@ -1028,7 +1030,7 @@ mpages_merge(struct mchars *mc, struct mparse *mp)
                }
                putkey(mpage, mpage->sec, TYPE_sec);
                putkey(mpage, '\0' == *mpage->arch ?
-                   "any" : mpage->arch, TYPE_arch);
+                   any : mpage->arch, TYPE_arch);
 
                for (mlink = mpage->mlinks; mlink; mlink = mlink->next) {
                        if ('\0' != *mlink->dsec)
@@ -1036,7 +1038,7 @@ mpages_merge(struct mchars *mc, struct mparse *mp)
                        if ('\0' != *mlink->fsec)
                                putkey(mpage, mlink->fsec, TYPE_sec);
                        putkey(mpage, '\0' == *mlink->arch ?
-                           "any" : mlink->arch, TYPE_arch);
+                           any : mlink->arch, TYPE_arch);
                        putkey(mpage, mlink->name, TYPE_Nm);
                }
 
@@ -1186,10 +1188,15 @@ parse_cat(struct mpage *mpage)
  * Put a type/word pair into the word database for this particular file.
  */
 static void
-putkey(const struct mpage *mpage, const char *value, uint64_t type)
+putkey(const struct mpage *mpage, char *value, uint64_t type)
 {
+       char     *cp;
 
        assert(NULL != value);
+       if (TYPE_arch == type)
+               for (cp = value; *cp; cp++)
+                       if (isupper((unsigned char)*cp))
+                               *cp = _tolower((unsigned char)*cp);
        putkeys(mpage, value, strlen(value), type);
 }
 
@@ -1443,7 +1450,7 @@ parse_mdoc_Fd(struct mpage *mpage, const struct mdoc_node *n)
 static int
 parse_mdoc_Fn(struct mpage *mpage, const struct mdoc_node *n)
 {
-       const char      *cp;
+       char    *cp;
 
        if (NULL == (n = n->child) || MDOC_TEXT != n->type)
                return(0);
@@ -1659,7 +1666,7 @@ static void
 render_key(struct mchars *mc, struct str *key)
 {
        size_t           sz, bsz, pos;
-       char             utfbuf[7], res[5];
+       char             utfbuf[7], res[6];
        char            *buf;
        const char      *seq, *cpp, *val;
        int              len, u;
@@ -1671,7 +1678,8 @@ render_key(struct mchars *mc, struct str *key)
        res[1] = '\t';
        res[2] = ASCII_NBRSP;
        res[3] = ASCII_HYPH;
-       res[4] = '\0';
+       res[4] = ASCII_BREAK;
+       res[5] = '\0';
 
        val = key->key;
        bsz = strlen(val);
@@ -1702,15 +1710,23 @@ render_key(struct mchars *mc, struct str *key)
                        val += sz;
                }
 
-               if (ASCII_HYPH == *val) {
+               switch (*val) {
+               case (ASCII_HYPH):
                        buf[pos++] = '-';
                        val++;
                        continue;
-               } else if ('\t' == *val || ASCII_NBRSP == *val) {
+               case ('\t'):
+                       /* FALLTHROUGH */
+               case (ASCII_NBRSP):
                        buf[pos++] = ' ';
                        val++;
+                       /* FALLTHROUGH */
+               case (ASCII_BREAK):
                        continue;
-               } else if ('\\' != *val)
+               default:
+                       break;
+               }
+               if ('\\' != *val)
                        break;
 
                /* Read past the slash. */
@@ -1860,6 +1876,8 @@ static void
 dbclose(int real)
 {
        size_t           i;
+       int              status;
+       pid_t            child;
 
        if (nodb)
                return;
@@ -1875,9 +1893,59 @@ dbclose(int real)
        if (real)
                return;
 
-       if (-1 == rename(MANDOC_DB "~", MANDOC_DB)) {
+       if ('\0' == *tempfilename) {
+               if (-1 == rename(MANDOC_DB "~", MANDOC_DB)) {
+                       exitcode = (int)MANDOCLEVEL_SYSERR;
+                       say(MANDOC_DB, "%s", strerror(errno));
+               }
+               return;
+       }
+
+       switch (child = fork()) {
+       case (-1):
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say("fork cmp", "%s", strerror(errno));
+               return;
+       case (0):
+               execlp("cmp", "cmp", "-s",
+                   tempfilename, MANDOC_DB, NULL);
+               say("exec cmp", "%s", strerror(errno));
+               exit(0);
+       default:
+               break;
+       }
+       if (-1 == waitpid(child, &status, 0)) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say("wait cmp", "%s", strerror(errno));
+       } else if (WIFSIGNALED(status)) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say("cmp", "Died from a signal");
+       } else if (WEXITSTATUS(status)) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say(MANDOC_DB,
+                   "Data changed, but cannot replace database");
+       }
+
+       *strrchr(tempfilename, '/') = '\0';
+       switch (child = fork()) {
+       case (-1):
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say("fork rm", "%s", strerror(errno));
+               return;
+       case (0):
+               execlp("rm", "rm", "-rf", tempfilename, NULL);
+               say("exec rm", "%s", strerror(errno));
+               exit((int)MANDOCLEVEL_SYSERR);
+       default:
+               break;
+       }
+       if (-1 == waitpid(child, &status, 0)) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say("wait rm", "%s", strerror(errno));
+       } else if (WIFSIGNALED(status) || WEXITSTATUS(status)) {
                exitcode = (int)MANDOCLEVEL_SYSERR;
-               say(MANDOC_DB, NULL);
+               say(tempfilename,
+                   "Cannot remove temporary directory");
        }
 }
 
@@ -1892,42 +1960,62 @@ dbclose(int real)
 static int
 dbopen(int real)
 {
-       const char      *file, *sql;
+       const char      *sql;
        int              rc, ofl;
 
        if (nodb) 
                return(1);
 
+       *tempfilename = '\0';
        ofl = SQLITE_OPEN_READWRITE;
-       if (0 == real) {
-               file = MANDOC_DB "~";
-               if (-1 == remove(file) && ENOENT != errno) {
+
+       if (real) {
+               rc = sqlite3_open_v2(MANDOC_DB, &db, ofl, NULL);
+               if (SQLITE_OK != rc) {
                        exitcode = (int)MANDOCLEVEL_SYSERR;
-                       say(file, NULL);
+                       say(MANDOC_DB, "%s", sqlite3_errmsg(db));
                        return(0);
                }
-               ofl |= SQLITE_OPEN_EXCLUSIVE;
-       } else
-               file = MANDOC_DB;
+               goto prepare_statements;
+       }
 
-       rc = sqlite3_open_v2(file, &db, ofl, NULL);
+       ofl |= SQLITE_OPEN_CREATE | SQLITE_OPEN_EXCLUSIVE;
+
+       remove(MANDOC_DB "~");
+       rc = sqlite3_open_v2(MANDOC_DB "~", &db, ofl, NULL);
        if (SQLITE_OK == rc) 
-               goto prepare_statements;
-       if (SQLITE_CANTOPEN != rc) {
+               goto create_tables;
+       if (MPARSE_QUICK & mparse_options) {
                exitcode = (int)MANDOCLEVEL_SYSERR;
-               say(file, NULL);
+               say(MANDOC_DB "~", "%s", sqlite3_errmsg(db));
                return(0);
        }
 
-       sqlite3_close(db);
-       db = NULL;
-
-       if (SQLITE_OK != (rc = sqlite3_open(file, &db))) {
+       if (strlcpy(tempfilename, "/tmp/mandocdb.XXXXXX",
+           sizeof(tempfilename)) >= sizeof(tempfilename)) {
                exitcode = (int)MANDOCLEVEL_SYSERR;
-               say(file, NULL);
+               say("/tmp/mandocdb.XXXXXX", "Filename too long");
+               return(0);
+       }
+       if (NULL == mkdtemp(tempfilename)) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say(tempfilename, "%s", strerror(errno));
+               return(0);
+       }
+       if (strlcat(tempfilename, "/" MANDOC_DB,
+           sizeof(tempfilename)) >= sizeof(tempfilename)) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say(tempfilename, "Filename too long");
+               return(0);
+       }
+       rc = sqlite3_open_v2(tempfilename, &db, ofl, NULL);
+       if (SQLITE_OK != rc) {
+               exitcode = (int)MANDOCLEVEL_SYSERR;
+               say(tempfilename, "%s", sqlite3_errmsg(db));
                return(0);
        }
 
+create_tables:
        sql = "CREATE TABLE \"mpages\" (\n"
              " \"form\" INTEGER NOT NULL,\n"
              " \"id\" INTEGER PRIMARY KEY AUTOINCREMENT NOT NULL\n"
@@ -1950,7 +2038,7 @@ dbopen(int real)
 
        if (SQLITE_OK != sqlite3_exec(db, sql, NULL, NULL, NULL)) {
                exitcode = (int)MANDOCLEVEL_SYSERR;
-               say(file, "%s", sqlite3_errmsg(db));
+               say(MANDOC_DB, "%s", sqlite3_errmsg(db));
                return(0);
        }