]> git.cameronkatri.com Git - mandoc.git/log
mandoc.git
10 years agoProperly handle symlinks (hardlinks and .so only files were already ok):
Ingo Schwarze [Sat, 19 Apr 2014 02:30:19 +0000 (02:30 +0000)]
Properly handle symlinks (hardlinks and .so only files were already ok):
Use the file name of the symlink but the inode number of the file pointed to,
such that we get multiple mlinks records but not multiple mpages records.
Also make sure they do not point outside the tree we are processing.

Issue found by kili@ in desktop-file-edit(1), thanks!

10 years agoIn update mode, when opening the database fails, probably because it is
Ingo Schwarze [Fri, 18 Apr 2014 21:55:38 +0000 (21:55 +0000)]
In update mode, when opening the database fails, probably because it is
missing or corrupt, just rebuild it from scratch.  This also helps when
installing the very first port on a freshly installed machine
and is similar to what espie@'s classical makewhatis(8) did.

Issue reported by naddy@ via kili@.

10 years agoSlowly, the dust begins to settle.
Ingo Schwarze [Fri, 18 Apr 2014 10:30:37 +0000 (10:30 +0000)]
Slowly, the dust begins to settle.
We are keeping the traditional name makewhatis(8).
No content change.

10 years agoFix a few lies; polish wording and formatting while here.
Ingo Schwarze [Fri, 18 Apr 2014 09:47:09 +0000 (09:47 +0000)]
Fix a few lies; polish wording and formatting while here.

10 years agoGarbage collect one pair of needless parentheses in SQL code generation;
Ingo Schwarze [Thu, 17 Apr 2014 19:20:01 +0000 (19:20 +0000)]
Garbage collect one pair of needless parentheses in SQL code generation;
note this doesn't affect performance, SQLite generates the same byte code.
While here, make the calls to exprspec() easier to understand.

10 years agoRename the mpages.id column to mpages.pageid. There is no good reason
Ingo Schwarze [Wed, 16 Apr 2014 21:36:18 +0000 (21:36 +0000)]
Rename the mpages.id column to mpages.pageid.  There is no good reason
to call this kid by a different name here than in all other tables.

10 years agoGive the mlinks and keys tables a pageid index,
Ingo Schwarze [Wed, 16 Apr 2014 18:59:43 +0000 (18:59 +0000)]
Give the mlinks and keys tables a pageid index,
as suggested by jeremy@ and espie@.

The mlinks index speeds up basic apropos(1) searches by around 30%
because it speeds up the final SELECT FROM mlinks query by about 95%.
For large result sets, the overall speedup gets even larger, in the
extreme case of "apropos Nd~." bymore than 90%.
The keys index finally makes the apropos(1) -O option usable: It no longer
incurs relevant extra cost, while in the past it was embarrassingly slow.

This comes at a cost:  Total database build times grow by about 5%,
and each index adds about 10% database size with -Q.  I consider that
acceptable in view of the huge apropos(1) performance gains.
The -Q database for /usr/share/man still remains below 1 MB.

10 years agoPass the function flags SQLITE_UTF8 (because SQLITE_ANY is deprecated)
Ingo Schwarze [Wed, 16 Apr 2014 00:33:47 +0000 (00:33 +0000)]
Pass the function flags SQLITE_UTF8 (because SQLITE_ANY is deprecated)
and SQLITE_DETERMINISTIC when creating deterministic functions;
best practice measure suggested by espie@ and jeremy@;
as expected by jeremy@, no measurable effect on performance.

10 years agoOops, sorry, revert previous and commit the correct patch:
Ingo Schwarze [Tue, 15 Apr 2014 23:51:39 +0000 (23:51 +0000)]
Oops, sorry, revert previous and commit the correct patch:
At the end of mansearch(), fchdir() back to where we started from.

10 years agoAt the end of mansearch(), fchdir() back to where we started from;
Ingo Schwarze [Tue, 15 Apr 2014 23:48:51 +0000 (23:48 +0000)]
At the end of mansearch(), fchdir() back to where we started from;
this is cleaner and helps to not scatter gmon.out files all over
the place when profiling.

10 years agoremove documentation of the former macro key "NAME";
Ingo Schwarze [Tue, 15 Apr 2014 23:02:27 +0000 (23:02 +0000)]
remove documentation of the former macro key "NAME";
it got deleted with mansearch.h rev. 1.12

10 years agoDocument the database format and SQL code generation;
Ingo Schwarze [Tue, 15 Apr 2014 20:18:26 +0000 (20:18 +0000)]
Document the database format and SQL code generation;
suggested by kristaps@ and espie@.

10 years agoUsing macros in .Sh header lines, or having .Sm off or .Bk -words open
Ingo Schwarze [Tue, 15 Apr 2014 00:41:09 +0000 (00:41 +0000)]
Using macros in .Sh header lines, or having .Sm off or .Bk -words open
while processing .Sh, is not at all recommended, but it's not strictly
a syntax violation either, and in any case, mandoc must not die in an
assertion.  I broke this in rev. 1.124.

Crash found while trying to read the (rather broken) original 4.3BSD-Reno
od(1) manual page.

10 years agoUnify description handling across all document types (mdoc, man, cat).
Ingo Schwarze [Sun, 13 Apr 2014 22:03:04 +0000 (22:03 +0000)]
Unify description handling across all document types (mdoc, man, cat).
Assert that the description is unset right before calling the parse_*
handler, and assign a default if it's still unset right afterwards.
Remove all stray asserts and default assignments found elsewhere.

This fixes SQL_STEP failures for man(7) pages lacking descriptions.

10 years agobetter error reporting in case of SQL errors: mention dir and file
Ingo Schwarze [Sun, 13 Apr 2014 20:55:45 +0000 (20:55 +0000)]
better error reporting in case of SQL errors: mention dir and file

10 years agoFurther apropos(1) speed optimization was trickier than anticipated.
Ingo Schwarze [Fri, 11 Apr 2014 15:46:52 +0000 (15:46 +0000)]
Further apropos(1) speed optimization was trickier than anticipated.
Contrary to what i initially thought, almost all time is now spent
inside sqlite3(3) routines, and i found no easy way calling less of them.
However, sqlite(3) spends substantial time in malloc(3), and even more
(twice that) in its immediate malloc wrapper, sqlite3MemMalloc(),
keeping track of all individual malloc chunk sizes.  Typically about
90% of the malloced memory is used for purposes of the pagecache.

By providing an mmap(3) MAP_ANON SQLITE_CONFIG_PAGECACHE, execution
time decreases by 20-25% for simple (Nd and/or Nm) queries, 10-20% for
non-NAME queries, and even apropos(1) resident memory size as reported
by top(1) decreases by 20% for simple and by 60% for non-NAME queries.
The new function, mansearch_setup(), spends no measurable time.

The pagesize chosen is optimal:
* Substantially smaller pages yield no gain at all.
* Larger pages provide no additional benefit and just waste memory.

The chosen number of pages in the cache is a compromise:
* For simple queries, a handful of pages would suffice to get the full
speed effect, at an apropos(1) resident memory size of about 2.0 MB.
* For non-NAME queries, a large pagecache with 2k pages (2.5 MB) might
gain a few more percent in speed, but at the expense of doubling the
apropos(1) resident memory size for *all* queries.
* The chosen number of 256 pages (330 kB) allows nearly full speed gain
for all queries at the price of a 15% resident memory size increase.

10 years agoNext speed optimization step for the new apropos(1).
Ingo Schwarze [Thu, 10 Apr 2014 02:46:21 +0000 (02:46 +0000)]
Next speed optimization step for the new apropos(1).
Split manual names out of the common "keys" table into their
own "names" table.  This reduces standard apropos(1) search
times (i.e. searching for names and descriptions only) by
typically about 70% for the full /usr/share/man database.
(Yes, that multiplies with the previous optimization step,
so both together have reduced search times by a factor of
more than six.  I'm not done yet, expect more to come.)

Even with the minimal databases built with makewhatis(8) -Q,
this step still reduces search times by 15-20%.  For both cases,
database sizes and build times hardly change (+/-2%).

10 years agoAfter careful gprof(1)ing of the new apropos(1), move the descriptions
Ingo Schwarze [Wed, 9 Apr 2014 21:50:08 +0000 (21:50 +0000)]
After careful gprof(1)ing of the new apropos(1), move the descriptions
back from the keys table to the mpages table:  I found a good way
to still use them in searches, without complication of the code.

On my notebook, this reduces typical apropos(1) search times by about 40%,
it reduces /usr/share/man database size by 6% in makewhatis(8) -Q mode
and by 2% in standard mode (less overhead storing pointers to mpages),
and it doesn't measurably change database build times (may even be
going down by a percent or so because less data is being copied
around in ohashes).

10 years agoAdd a new term_flushln() flag TERMP_BRIND (if break, then indent)
Ingo Schwarze [Tue, 8 Apr 2014 07:13:11 +0000 (07:13 +0000)]
Add a new term_flushln() flag TERMP_BRIND (if break, then indent)
to control indentation of continuation lines in TERMP_NOBREAK mode.
In the past, this was always on; continue using it
for .Bl, .Nm, .Fn, .Fo, and .HP, but no longer for .IP and .TP.

I looked at this because sthen@ reported the issue in a manual
of a Perl module from ports, but it affects base, too: This patch
reduces groff-mandoc differences in base by more than 15%.

10 years agoIf the SYNOPSIS section contains an excessively long .Nm,
Ingo Schwarze [Tue, 8 Apr 2014 04:40:47 +0000 (04:40 +0000)]
If the SYNOPSIS section contains an excessively long .Nm,
adjust the right margin to avoid running into an assertion;
output in that case now agrees with groff, too.

10 years agoFully implement the \B (validate numerical expression) and
Ingo Schwarze [Tue, 8 Apr 2014 01:37:27 +0000 (01:37 +0000)]
Fully implement the \B (validate numerical expression) and
partially implement the \w (measure text width) escape sequence
in a way that makes them usable in numerical expressions and in
conditional requests, similar to how \n (interpolate number register)
and \* (expand user-defined string) are implemented.

This lets mandoc(1) handle the baroque low-level roff code
found at the beginning of the ggrep(1) manual.
Thanks to pascal@ for the report.

10 years agoWe already supported (outer) user-defined strings containing references
Ingo Schwarze [Mon, 7 Apr 2014 21:00:08 +0000 (21:00 +0000)]
We already supported (outer) user-defined strings containing references
to other (inner) user-defined strings in their values, such that the inner
ones get expanded at expansion time of the outer ones (delayed evaluation).
Now we also support specifying the name of an (outer) user-defined
string to expand using the expanded values of some other (inner)
user-defined strings (indirect reference).

10 years agoMake it clear which errors come from which tool.
Ingo Schwarze [Mon, 7 Apr 2014 18:26:10 +0000 (18:26 +0000)]
Make it clear which errors come from which tool.
joint work with sthen@

10 years agoAccept arbitrary argument delimiters for various roff(7) escape sequences.
Ingo Schwarze [Mon, 7 Apr 2014 17:51:10 +0000 (17:51 +0000)]
Accept arbitrary argument delimiters for various roff(7) escape sequences.
Needed for example by the new Perl pod2man(1) preamble.

10 years agoAlmost complete implementation of roff(7) numerical expressions.
Ingo Schwarze [Mon, 7 Apr 2014 15:07:13 +0000 (15:07 +0000)]
Almost complete implementation of roff(7) numerical expressions.
Support all binary operators except ';' (scale conversion).
Fully support chained operations and nested parentheses.
Use this for the .nr, .if, and .ie requests.
While here, fix parsing of integer numbers in roff_getnum().

10 years agobugfix: make sure all variables are properly initialized
Ingo Schwarze [Sat, 5 Apr 2014 21:18:19 +0000 (21:18 +0000)]
bugfix: make sure all variables are properly initialized
when rendering .ll (line length) requests.  oops.

10 years agoImplement the roff(7) .rr (remove register) request.
Ingo Schwarze [Sat, 5 Apr 2014 20:34:57 +0000 (20:34 +0000)]
Implement the roff(7) .rr (remove register) request.
As reported by sthen@, the perl-5.18 pod2man(1) preamble
thinks cool kids use that in manuals.  I hope *you* know better.

10 years agoIn -p (picky) mode, warn unless each filename (aka mlink)
Ingo Schwarze [Fri, 4 Apr 2014 18:23:30 +0000 (18:23 +0000)]
In -p (picky) mode, warn unless each filename (aka mlink)
appears as a name in the NAME section.
While here, garbage collect two unused variables, both called "match".

10 years agoWarn about missing mlinks.
Ingo Schwarze [Fri, 4 Apr 2014 16:43:16 +0000 (16:43 +0000)]
Warn about missing mlinks.
This is really expensive, more than tripling database build times,
so only do it when the -p (picky) option was given, but none of the
following options were given: -Q (quick), -d, -u, or -t.

10 years agoRemember which names are in the NAME section.
Ingo Schwarze [Fri, 4 Apr 2014 15:55:19 +0000 (15:55 +0000)]
Remember which names are in the NAME section.
This helps to find missing MLINKS.
Database build times do not change and database growth is minimal
(1.2% with -Q, 0.7% without -Q in /usr/share/man),
so making this optional would be pointless.

10 years agomerge OpenBSD rev. 1.20, describing new features
Ingo Schwarze [Fri, 4 Apr 2014 15:51:28 +0000 (15:51 +0000)]
merge OpenBSD rev. 1.20, describing new features

10 years agoWhen the -n or -t flag is given to makewhatis(8),
Ingo Schwarze [Fri, 4 Apr 2014 02:31:07 +0000 (02:31 +0000)]
When the -n or -t flag is given to makewhatis(8),
write names and decriptions to stdout,
in a format similar to apropos(1) output.
Inspired by espie@'s makewhatis.

10 years agoInstead of silently doing nothing at all,
Ingo Schwarze [Thu, 3 Apr 2014 21:45:31 +0000 (21:45 +0000)]
Instead of silently doing nothing at all,
warn and return non-zero when the manpath is empty, that is,
when /etc/man.conf is non-existent or unreadable
AND the environment variable MANPATH is unset or empty
AND no directories were given on the command line.

Inspired by the error handling in espie@'s makewhatis(8),
except that one doesn't know about MANPATH.

10 years agoRename the -W option to -p (mnemonics: picky, print to stderr):
Ingo Schwarze [Thu, 3 Apr 2014 16:27:28 +0000 (16:27 +0000)]
Rename the -W option to -p (mnemonics: picky, print to stderr):
That letter was already chosen by espie@ for OpenBSD 2.7,
so avoid being gratuitiously different more than a decade later.
Accept -v for backward compatibility with espie@'s makewhatis,
even though it does nothing right now.

10 years agoThe -v option of mandocdb(8) clashes with the -v option of espie@'s
Ingo Schwarze [Thu, 3 Apr 2014 15:37:19 +0000 (15:37 +0000)]
The -v option of mandocdb(8) clashes with the -v option of espie@'s
makewhatis(8), which traditionally does something different,
so rename it to -D (mnemonics: Debug, Dump, Display).

10 years agodocument -Q and -T; from OpenBSD
Ingo Schwarze [Thu, 3 Apr 2014 15:24:32 +0000 (15:24 +0000)]
document -Q and -T; from OpenBSD

10 years agoSupport the CONTEXT section for kernel manual pages found in Solaris and
Ingo Schwarze [Mon, 31 Mar 2014 01:05:32 +0000 (01:05 +0000)]
Support the CONTEXT section for kernel manual pages found in Solaris and
OpenBSD manuals.  It describes which contexts you can call functions in.
from dlg@, ok jmc@ deraadt@

10 years agoImprove formatting of broken blocks in -Tman,
Ingo Schwarze [Sun, 30 Mar 2014 23:34:32 +0000 (23:34 +0000)]
Improve formatting of broken blocks in -Tman,
somewhat similar to what mdoc_term.c already does for -Tascii.
OpenBSD rev. 1.58.

10 years agoAllow ERRORS in section 4; OpenBSD rev. 1.121.
Ingo Schwarze [Sun, 30 Mar 2014 23:28:06 +0000 (23:28 +0000)]
Allow ERRORS in section 4; OpenBSD rev. 1.121.

10 years agoSupport relative arguments to .ll (increase or decrease line length).
Ingo Schwarze [Sun, 30 Mar 2014 21:28:01 +0000 (21:28 +0000)]
Support relative arguments to .ll (increase or decrease line length).

10 years agoImplement the roff(7) .ll (line length) request.
Ingo Schwarze [Sun, 30 Mar 2014 19:47:48 +0000 (19:47 +0000)]
Implement the roff(7) .ll (line length) request.
Found by naddy@ in the textproc/enchant(1) port.
Of course, do not use this in new manuals.

10 years agoAllow leading and trailing vertical lines,
Ingo Schwarze [Fri, 28 Mar 2014 23:26:25 +0000 (23:26 +0000)]
Allow leading and trailing vertical lines,
and format them in the same way as groff.
While here, do not require whitespace before vertical lines
in layout specifications.
Issues found by bentley@ in mpv(1).

10 years agoProperly initialize malloc(3)ed memory.
Ingo Schwarze [Fri, 28 Mar 2014 19:17:12 +0000 (19:17 +0000)]
Properly initialize malloc(3)ed memory.
With this bug fix, partly unitialized memory could sometimes be
returned, sometimes causing crashes by bogus free(3)s in apropos(1).

10 years agoWithout bloating mandoc(1) itself, let mandocdb(8) support files
Ingo Schwarze [Wed, 26 Mar 2014 21:39:38 +0000 (21:39 +0000)]
Without bloating mandoc(1) itself, let mandocdb(8) support files
called manN/X.N.gz and catN/X.0.gz, reading them through a pipe(2)
from gunzip(1) -c.  Asked for by various people in the past.

10 years agoImprove error reporting.
Ingo Schwarze [Wed, 26 Mar 2014 20:53:36 +0000 (20:53 +0000)]
Improve error reporting.
Simplify combining a custom format string with perror(),
avoiding many manual calls to strerror(errno).
For low-level failures, report attempted function calls.
Do not abuse the say() filename argument for files outside the basedir,
and even less for other text.

10 years agoSkip leading escape sequences in man_deroff(). Helps indexing of
Ingo Schwarze [Sun, 23 Mar 2014 20:57:27 +0000 (20:57 +0000)]
Skip leading escape sequences in man_deroff().  Helps indexing of
some manuals containing overzealous escaping in their NAME section.

10 years agoRetire the old concat() function.
Ingo Schwarze [Sun, 23 Mar 2014 15:14:50 +0000 (15:14 +0000)]
Retire the old concat() function.
For .Sh, i wasn't even needed at all.
For .Dd, .Nm, and .Os, use the new mdoc_deroff() instead.
This gets rid of the last limited-size static buffers in this file,
hence eliminates the last explicit MANDOCERR_MEM throwers here,
and it shortens the code by 50 lines.

10 years agoIf an .Nd block contains macros, avoid fragmented entries in mandocdb(8),
Ingo Schwarze [Sun, 23 Mar 2014 12:44:56 +0000 (12:44 +0000)]
If an .Nd block contains macros, avoid fragmented entries in mandocdb(8),
instead use the .Nd content recursively.

10 years agoIf a man(7) NAME section contains macros, avoid truncated or empty
Ingo Schwarze [Sun, 23 Mar 2014 12:26:58 +0000 (12:26 +0000)]
If a man(7) NAME section contains macros, avoid truncated or empty
entries for .Nd in mandocdb(8), instead use the macro content
recursively.  This improves indexing of more than 200 manuals
in Xenocara, i.e. more than 15%, in particular GL and some Xkb.

10 years agoneeds mandoc_aux, too
Ingo Schwarze [Sun, 23 Mar 2014 12:19:03 +0000 (12:19 +0000)]
needs mandoc_aux, too

10 years agoavoid repetitive code for asprintf error handling
Ingo Schwarze [Sun, 23 Mar 2014 12:11:18 +0000 (12:11 +0000)]
avoid repetitive code for asprintf error handling

10 years agoThe files mandoc.c and mandoc.h contained both specialised low-level
Ingo Schwarze [Sun, 23 Mar 2014 11:59:17 +0000 (11:59 +0000)]
The files mandoc.c and mandoc.h contained both specialised low-level
functions used for multiple languages (mdoc, man, roff), for example
mandoc_escape(), mandoc_getarg(), mandoc_eos(), and generic auxiliary
functions.  Split the auxiliaries out into their own file and header.

10 years agoThe files mandoc.c and mandoc.h contained both specialised low-level
Ingo Schwarze [Sun, 23 Mar 2014 11:25:25 +0000 (11:25 +0000)]
The files mandoc.c and mandoc.h contained both specialised low-level
functions used for multiple languages (mdoc, man, roff), for example
mandoc_escape(), mandoc_getarg(), mandoc_eos(), and generic auxiliary
functions.  Split the auxiliaries out into their own file and header.
While here, do some #include cleanup.

10 years agoRemove currently unimplemented macros from the lists of used-defined
Ingo Schwarze [Thu, 20 Mar 2014 02:57:28 +0000 (02:57 +0000)]
Remove currently unimplemented macros from the lists of used-defined
macros to be cleared during .Dd and .TH because clearing them at that
point defeats the purpose of backup implementations provided in the
manual page itself, some of which _do_ work with mandoc(1).
While here, add the new .%C macro to the list to be cleared.

10 years agoRegister pure .so pages as mlinks, not as mpages.
Ingo Schwarze [Wed, 19 Mar 2014 22:33:09 +0000 (22:33 +0000)]
Register pure .so pages as mlinks, not as mpages.
This doesn't affect /usr/share/man, but improves /usr/X11R6/man:
* Eliminates multiple apropos(1) output for such pages.
* Reduces X11R6 database size from 450 kB to 240 kB (-47%).
* Reduces X11R6 database build time from 1.68s to 1.00s (-40%).

10 years agoWithout the MPARSE_SO option, if the file contains nothing but a
Ingo Schwarze [Wed, 19 Mar 2014 22:20:43 +0000 (22:20 +0000)]
Without the MPARSE_SO option, if the file contains nothing but a
single .so request, do not read the file pointed to, but instead
let mparse_result() provide the file name pointed to as a return
value.  To be used by makewhatis(8) in the future.

10 years agocope with mparse_alloc() interface change
Ingo Schwarze [Wed, 19 Mar 2014 22:05:10 +0000 (22:05 +0000)]
cope with mparse_alloc() interface change

10 years agoGeneralize the mparse_alloc() and roff_alloc() functions by giving
Ingo Schwarze [Wed, 19 Mar 2014 21:51:20 +0000 (21:51 +0000)]
Generalize the mparse_alloc() and roff_alloc() functions by giving
them an "options" argument, replacing the existing "inttype" and
"quick" arguments, preparing for a future MPARSE_SO option.
Store this argument in struct mparse and struct roff, replacing the
existing "inttype", "parsetype", and "quick" members.
No functional change except one tiny cosmetic fix in roff_TH().

10 years agoAllow checking that databases are up to date even when you have no write
Ingo Schwarze [Tue, 18 Mar 2014 16:56:10 +0000 (16:56 +0000)]
Allow checking that databases are up to date even when you have no write
permission on the databases, as requested by espie@ quite some time ago.
But make sure to not slow database generation down when you do have write
permission, and to not delay error reporting in -Q mode.

10 years agoin apropos(1) output, sort names and avoid multiple section numbers
Ingo Schwarze [Mon, 17 Mar 2014 16:31:44 +0000 (16:31 +0000)]
in apropos(1) output, sort names and avoid multiple section numbers

10 years agoSync to OpenBSD:
Ingo Schwarze [Mon, 17 Mar 2014 09:43:56 +0000 (09:43 +0000)]
Sync to OpenBSD:
* do not talk about shell globbing
* describe logical operations
* improve examples
* add HISTORY
* some wording improvements for clarity

10 years agominor sync to OpenBSD
Ingo Schwarze [Mon, 17 Mar 2014 08:34:00 +0000 (08:34 +0000)]
minor sync to OpenBSD

10 years agosync to OpenBSD: .ft is a roff(7) request, not a man(7) macro,
Ingo Schwarze [Mon, 17 Mar 2014 06:57:48 +0000 (06:57 +0000)]
sync to OpenBSD: .ft is a roff(7) request, not a man(7) macro,
and it is not even used frequently in man(7)

10 years agoIn -Tutf8 mode, make sure that hyphens get counted against the output line
Ingo Schwarze [Thu, 13 Mar 2014 19:23:50 +0000 (19:23 +0000)]
In -Tutf8 mode, make sure that hyphens get counted against the output line
length even when they are breakable.  Before this, a line containing N
breakable hyphens could get up to N characters wider than the right margin
in -Tutf8 output mode.
Issue reported by tedu@ on <bugs at OpenBSD>.

10 years agonew bug report from wiz@ regarding Tcl*(3)
Ingo Schwarze [Sat, 8 Mar 2014 21:54:39 +0000 (21:54 +0000)]
new bug report from wiz@ regarding Tcl*(3)

10 years agoIn .nf mode, use the MAN_LINE flag to detect input line breaks
Ingo Schwarze [Sat, 8 Mar 2014 16:22:04 +0000 (16:22 +0000)]
In .nf mode, use the MAN_LINE flag to detect input line breaks
instead of the man_node line member.  This is required to preserve
line breaks contained in user-defined macros called in .nf mode.
Found in a code audit triggered by fixing a similar issue in .TP.

10 years agoTo find out whether .TP head arguments are same-line or next-line arguments,
Ingo Schwarze [Sat, 8 Mar 2014 15:50:41 +0000 (15:50 +0000)]
To find out whether .TP head arguments are same-line or next-line arguments,
use the MAN_LINE flag instead of the man_node line member.
This is required such that user-defined macros wrapping .TP work correctly.

Issue found by Havard Eidnes in Tcl_NewStringObj(3), reported via
the NetBSD bug tracking system and Thomas Klausner <wiz at NetBSD>.

10 years agoImprove .if/.ie condition handling.
Ingo Schwarze [Sat, 8 Mar 2014 04:43:54 +0000 (04:43 +0000)]
Improve .if/.ie condition handling.
* Support string comparisons.
* Support negation not only for numerical, but for all conditions.
* Switch the `o' condition from false to true.
* Handle the `c', `d', and `r' conditions as false for now.
* Use int for boolean data instead of rolling our own "enum roffrule";
needed such that we can use the standard ! and == operators.

Havard Eidnes reported via the NetBSD bug tracking system that some
Tcl*(3) manuals need this, and Thomas Klausner <wiz at NetBSD>
forwarded the report to me.  This doesn't make the crazy Tcl*(3)
macrology maze happy yet, but brings us a bit closer.

10 years agoIn roff_cond_sub(), make sure that the incorrect input sequence `\\}',
Ingo Schwarze [Fri, 7 Mar 2014 18:37:37 +0000 (18:37 +0000)]
In roff_cond_sub(), make sure that the incorrect input sequence `\\}',
when found on a macro line, does not close a conditional block.
The companion function roff_cond_text() already did this correctly,
but make the code more readable without functional change.
While here, report the correct column number in related error messages.

10 years agoEven on macro lines, \} must not cause whitespace.
Ingo Schwarze [Fri, 7 Mar 2014 18:30:11 +0000 (18:30 +0000)]
Even on macro lines, \} must not cause whitespace.

10 years agoThree bugfixes related to the closing of conditional blocks:
Ingo Schwarze [Fri, 7 Mar 2014 02:22:05 +0000 (02:22 +0000)]
Three bugfixes related to the closing of conditional blocks:
1. Handle more than one `\}' on macro lines, as it was already done
for text lines.
2. Do not treat `\}' as a macro invocation after a dot at the beginning
of a line.  That allows more than one `\}' to work on lines starting
with `.\}'.  It also simplifies the code.
3. Do not complain about characters following `\}'.  Those are not lost,
but handled normally both on text and macro lines.

10 years agoIn -Tutf8 mode, mandoc_char(7) named accent character escape sequences
Ingo Schwarze [Wed, 5 Mar 2014 23:14:46 +0000 (23:14 +0000)]
In -Tutf8 mode, mandoc_char(7) named accent character escape sequences
have to render as non-combining accents; if you want combining accents,
you have to explicitly specify them using the Unicode character numbers
for combining accents, or you can use character escape sequences for
accented characters.  This lets mandoc behave like groff.

Additionally, both the Ossanna/Kernighan/Ritter troff manual and
the GNU troff manual say that \' and \` are equivalent to \(aa and
\(ga, respectively, so do the same for these.  This mitigates issues
with man(7) code autogenerated by texinfo2man(1), which mistranslates
TeX ` and ' to \` and \' instead of \(oq and \(cq as reported by
sthen@ and as analyzed by bentley@.

10 years ago- remove index.html, it is now part of the website repo
Ingo Schwarze [Mon, 3 Mar 2014 18:53:27 +0000 (18:53 +0000)]
- remove index.html, it is now part of the website repo
- install mandocdb, manpage, and apropos
- and some general cleanup (e.g., installcgi is .PHONY)

10 years agoMANDOCERR_BADTAB needs checking, but .UR/.UE is done
Ingo Schwarze [Mon, 3 Mar 2014 18:37:32 +0000 (18:37 +0000)]
MANDOCERR_BADTAB needs checking, but .UR/.UE is done

10 years agoMove the regression suite to the attic.
Ingo Schwarze [Mon, 3 Mar 2014 17:08:26 +0000 (17:08 +0000)]
Move the regression suite to the attic.
It has not been used or maintained for several years,
and we won't start using it now.
Devlopment regression testing is done in OpenBSD, and
there is no value in maintaining two regression suites in parallel.

10 years agoAfter Werner Lemberg accepted and committed some updates to the manual
Ingo Schwarze [Sun, 16 Feb 2014 14:26:55 +0000 (14:26 +0000)]
After Werner Lemberg accepted and committed some updates to the manual
page template contained in groff_mdoc(7), catch up with our own stuff.
In particular, allow ERRORS in section 4 and DIAGNOSTICS in section 9.
ok jmc@

10 years agowhen indenting, extend the right margin accordingly, when needed;
Ingo Schwarze [Sun, 16 Feb 2014 12:33:39 +0000 (12:33 +0000)]
when indenting, extend the right margin accordingly, when needed;
fixes a crash reported by blambert@ and a few other, similar ones

10 years agodocument .as and .ce
Ingo Schwarze [Fri, 14 Feb 2014 23:50:57 +0000 (23:50 +0000)]
document .as and .ce

10 years agoParse and ignore the roff(7) .ce request (center some lines).
Ingo Schwarze [Fri, 14 Feb 2014 23:24:26 +0000 (23:24 +0000)]
Parse and ignore the roff(7) .ce request (center some lines).

We even parse and ignore the .ad request (adjustment mode),
and it doesn't make sense to more prominently warn about
temporary than about permanent adjustment changes.

Request found by naddy@ in xloadimage(1) and by juanfra@ in racket(1).

10 years agoImplement the roff(7) .as request (append to user-defined string).
Ingo Schwarze [Fri, 14 Feb 2014 23:05:20 +0000 (23:05 +0000)]
Implement the roff(7) .as request (append to user-defined string).
Missing feature found by jca@ in ratpoison(1).
The ratpoison(1) manual still doesn't work because it uses .shift
and .while, too (apparently, ratpoison is so complex that it
needs a Turing-complete language to even format its manual :-).

Written at Christchurch International Airport.

10 years agoHandle some predefined read-only number registers, e.g. .H and .V.
Ingo Schwarze [Fri, 14 Feb 2014 22:27:41 +0000 (22:27 +0000)]
Handle some predefined read-only number registers, e.g. .H and .V.
In particular, this improves handling of the pod2man(1) preamble;
for examples of the effect, see some author names in perlthrtut(1).

Missing feature reported by Andreas Voegele <mail at andreasvoegele dot com>
more than two years ago.  Written at Christchurch International Airport.

10 years agouse .At where appropriate; from Jan Stary <hans at stare dot cz>
Ingo Schwarze [Fri, 14 Feb 2014 17:35:05 +0000 (17:35 +0000)]
use .At where appropriate; from Jan Stary <hans at stare dot cz>

10 years agoSupplement the documentation of the .St macro by minimal commentary
Ingo Schwarze [Fri, 24 Jan 2014 22:54:33 +0000 (22:54 +0000)]
Supplement the documentation of the .St macro by minimal commentary
regarding the content and relationships of the various standards,
and sort and group them.
tweaks and ok guenther@, ok millert@ sobrado@ jmc@

10 years agoImplement the \: (optional line break) escape sequence,
Ingo Schwarze [Wed, 22 Jan 2014 20:58:39 +0000 (20:58 +0000)]
Implement the \: (optional line break) escape sequence,
documented in the Ossanna-Kernighan-Ritter troff manual
and also supported by groff.

Missing feature reported by Steffen Nurpmeso <sdaoden at gmail dot com>.

10 years agoTreat the line after .Cd as a single argument.
Ingo Schwarze [Tue, 21 Jan 2014 10:26:53 +0000 (10:26 +0000)]
Treat the line after .Cd as a single argument.
This doesn't hurt normal manual display
and makes the mandocdb(8) database more useful.

10 years agoKeep words after .Ic together in a single argument.
Ingo Schwarze [Mon, 20 Jan 2014 11:28:29 +0000 (11:28 +0000)]
Keep words after .Ic together in a single argument.
This doesn't hurt normal manual display
and makes the mandocdb(8) database more useful.

10 years agoChange markup of some fixed strings from .Ar to .Cm.
Ingo Schwarze [Mon, 20 Jan 2014 00:51:43 +0000 (00:51 +0000)]
Change markup of some fixed strings from .Ar to .Cm.

10 years agoAlways compare arch case-insensitively.
Ingo Schwarze [Sun, 19 Jan 2014 23:09:30 +0000 (23:09 +0000)]
Always compare arch case-insensitively.

10 years agoAvoid the risk of trying to modify a literal string.
Ingo Schwarze [Sun, 19 Jan 2014 22:48:16 +0000 (22:48 +0000)]
Avoid the risk of trying to modify a literal string.

10 years agoAlways store the arch in lower-case only.
Ingo Schwarze [Sun, 19 Jan 2014 22:41:25 +0000 (22:41 +0000)]
Always store the arch in lower-case only.
Reduces database size by ~0.5%, and by ~1.5% with -Q.

10 years agoGet rid of the local keys table, use the new mansearch_const.c.
Ingo Schwarze [Sun, 19 Jan 2014 01:18:34 +0000 (01:18 +0000)]
Get rid of the local keys table, use the new mansearch_const.c.
No functional change.

11 years agoSupport a second -v on mandocdb(8) to show keys while they are being added;
Ingo Schwarze [Sun, 19 Jan 2014 00:09:38 +0000 (00:09 +0000)]
Support a second -v on mandocdb(8) to show keys while they are being added;
i need that for debugging, in particular to be used with -t.
To be able to do so, provide a global table of key names, for reuse.

11 years agoCope with slightly broken NAME sections in man(7) pages
Ingo Schwarze [Sat, 18 Jan 2014 08:55:17 +0000 (08:55 +0000)]
Cope with slightly broken NAME sections in man(7) pages
having a trailing comma after the last name, like this:

ASN1_OBJECT_new, ASN1_OBJECT_free, - object allocation functions

11 years agoSort the macro keys by their real-world frequency to reduce the average
Ingo Schwarze [Sat, 18 Jan 2014 08:23:55 +0000 (08:23 +0000)]
Sort the macro keys by their real-world frequency to reduce the average
mask size.  No functional change.

This shrinks the standard /usr/share/man database by 7%, now at 10.3x
the size of whatis.db, and with -Q even by 11%, now at 3.0x of whatis.db.
Now i'm out of ideas to easily shrink the size of the database.

11 years agoDrop the AUTOINCREMENT PRIMARY KEYs from the mlinks and keys tables.
Ingo Schwarze [Sat, 18 Jan 2014 08:21:03 +0000 (08:21 +0000)]
Drop the AUTOINCREMENT PRIMARY KEYs from the mlinks and keys tables.
They are completely unused, and i cannot imagine what they *could*
ever be used for; but apparently, they are expensive to generate.

Standard DB build time goes down by 10%, now at 1.9x of makewhatis.
Standard DB size goes down by 4%, now at 11x of makewhatis.
DB build time with -Q goes down by 15%, now at 0.28x of makewhatis.
DB size with -Q goes down by 3%, now at 3.35x of makewhatis.

11 years agoDespite some experimenting, i'm unable to find any relevant effect of
Ingo Schwarze [Sat, 18 Jan 2014 08:19:18 +0000 (08:19 +0000)]
Despite some experimenting, i'm unable to find any relevant effect of
creating an index for the keys table on apropos(1) search times;
apparently, adding that index was premature optimization in the first
place; so, stop adding that index.

Its root gone, the following evil is reduced (/usr/share/man on my notebook)
 - DB build time with -Q goes down by 15%, now at 1/3 of makewhatis
 - DB size with -Q goes down by 35%, now at 3.5x of makewhatis
 - full DB build time goes down by 12%, now at 2.1x of makewhatis
 - full DB size goes down by 42%, now at 11.5x of makewhatis

11 years agoRemove useless use of strnlen(3).
Ingo Schwarze [Sat, 11 Jan 2014 22:16:10 +0000 (22:16 +0000)]
Remove useless use of strnlen(3).
Yuckiness pointed out by deraadt@.

11 years agoCache the result of uname(3) such that we don't need to call it
Ingo Schwarze [Tue, 7 Jan 2014 09:10:45 +0000 (09:10 +0000)]
Cache the result of uname(3) such that we don't need to call it
over and over again for each manual; found with gprof(1).
Speeds up mandocdb(8) -Q by 3%, now at 39.5% of makewhatis(8).

11 years agoGprof(1) is fun. You should use it more often.
Ingo Schwarze [Mon, 6 Jan 2014 23:46:07 +0000 (23:46 +0000)]
Gprof(1) is fun.  You should use it more often.

Another 10% speedup for mandocdb(8) -Q, and even 3% without -Q.
With -Q, we are now at 41% of the time required by makewhatis(8).

Do not copy predefined strings into the dynamic string table, just
leave them in their own static table and use that one as a fallback
at lookup time.  This saves us copying and deleting them for each manual.
No functional change.

11 years agoAnother 18% speedup for mandocdb(8) -Q, found by gprof(1).
Ingo Schwarze [Mon, 6 Jan 2014 22:39:25 +0000 (22:39 +0000)]
Another 18% speedup for mandocdb(8) -Q, found by gprof(1).
In -Q mode, refrain form validating and normalizing the format
of the date given in .Dd or .TH, as it won't be used anyway.

For /usr/share/man, mandocdb -Q now takes 45% of the time of makewhatis(8).