]> git.cameronkatri.com Git - mandoc.git/log
mandoc.git
5 years agoSlowly start implementing tagging support for man(7) pages, even
Ingo Schwarze [Mon, 22 Jul 2019 03:21:49 +0000 (03:21 +0000)]
Slowly start implementing tagging support for man(7) pages, even
though it is obvious that this can never become as good as for
mdoc(7) pages.  As a first step, tag alphabetic arguments of .IP
macros, which are often used for lists of options and keywords.

Try "man -O tag=g as" to get the point.

Thanks to Leah Neukirchen for recently reminding me that exploring
how much can be done in this respect may be worthwhile: it is likely
to slightly improve usability while adding only small amounts of
relatively straightforward code.

5 years agoIf no tags were generated at all, unlink(2) the empty tags file as
Ingo Schwarze [Fri, 19 Jul 2019 20:27:25 +0000 (20:27 +0000)]
If no tags were generated at all, unlink(2) the empty tags file as
soon as the condition can be detected and do not pass it to less(1).
This may happen for man(7) pages, for preformatted pages, and for
very simple pages like true(1).  The main benefit is that :t inside
less(1) yields the clearer diagnostic message "No tags file" rather
than the mildly confusing "No such tag in tags file": the latter
might encourage further, futile attempts to jump to other tags.

Improvement suggested by Leah Neukirchen <leah at vuxu dot org>
from The Void.

5 years agonew test for an empty text block; from rea@ via bapt@ (FreeBSD)
Ingo Schwarze [Thu, 18 Jul 2019 14:43:14 +0000 (14:43 +0000)]
new test for an empty text block; from rea@ via bapt@ (FreeBSD)

5 years agodon't print the final heads-up about messages
Ingo Schwarze [Mon, 15 Jul 2019 21:41:08 +0000 (21:41 +0000)]
don't print the final heads-up about messages
when a search did not yield any manual pages to display;
issue found with regress/usr.bin/mandoc/db/

5 years agoexplain escaping of end-of-sentence characters;
Ingo Schwarze [Mon, 15 Jul 2019 19:20:30 +0000 (19:20 +0000)]
explain escaping of end-of-sentence characters;
missing info reported by Ian <ropers at gmail dot com> on misc@

5 years agoIf messages are shown and output is printed without a pager, display
Ingo Schwarze [Sun, 14 Jul 2019 18:16:13 +0000 (18:16 +0000)]
If messages are shown and output is printed without a pager, display
a heads-up on stderr at the end because otherwise, users may easily
miss the messages: because messages typically occur while parsing,
they typically preceed the output.  This is most useful with flag
combinations like "-c -W all" but may also help in some unusual
error scenarios.
Inconvenient ordering of output originally pointed out by espie@
for the example situation that /tmp/ is not writeable.

5 years agoWhen parsing a tab character that is not preceded by a space character
Ingo Schwarze [Thu, 11 Jul 2019 17:06:17 +0000 (17:06 +0000)]
When parsing a tab character that is not preceded by a space character
on an .It -column line, args() sets the MDOC_PHRASEQL flag to Quote
the Last word of the Phrase.  Even if it turns out this quoting is not
needed because the word is already quoted for other reasons, clear the
flag at the end of parsing the phrase, such that the flag does not leak
to the next phrase.

This patch fixes the bug that the trailing Macro on a line of the form
.It "word<tab>word" Ta word Macro<eol>
was incorrectly considered quoted and hence not parsed.

Bug found by Havard Eidnes (he@) with the NetBSD gettytab(5) manual page:
https://gnats.netbsd.org/cgi-bin/query-pr-single.pl?number=54361
Reported via Thomas Klausner (wiz@).

5 years agoSome time ago, i simplified mandoc_msg() such that it can be used
Ingo Schwarze [Wed, 10 Jul 2019 19:39:01 +0000 (19:39 +0000)]
Some time ago, i simplified mandoc_msg() such that it can be used
everywhere and not only in the parsers.
For more uniform messages, use it at more places instead of err(3),
in particular in the main program.
While here, integrate a few trivial functions called at exactly one
place into the main option parser, and let a few more functions use
the normal convention of returning 0 for success and -1 for error.

5 years agoin man.cgi(8), disable -O toc by default; requested by deraadt@
Ingo Schwarze [Wed, 10 Jul 2019 12:49:20 +0000 (12:49 +0000)]
in man.cgi(8), disable -O toc by default; requested by deraadt@

5 years agoThe non-standard .EX/.EE macro pair was invented for Version 9 AT&T UNIX
Ingo Schwarze [Tue, 9 Jul 2019 03:46:59 +0000 (03:46 +0000)]
The non-standard .EX/.EE macro pair was invented for Version 9 AT&T UNIX
and only got adopted by GNU two decades later.
Thanks to Doug McIlroy <doug at cs dot dartmouth dot edu>
for pointing out the error.

5 years agoprevent mandoc from segfaulting if /tmp is not writable;
Ingo Schwarze [Sat, 6 Jul 2019 20:05:27 +0000 (20:05 +0000)]
prevent mandoc from segfaulting if /tmp is not writable;
patch from espie@

5 years agouse the standard spelling of the word "idiosyncrasy";
Ingo Schwarze [Mon, 1 Jul 2019 23:30:16 +0000 (23:30 +0000)]
use the standard spelling of the word "idiosyncrasy";
suggested by Michal Nowak <mnowak at startmail dot com>

5 years agodelete trailing whitespace and space-tab sequences; no code change;
Ingo Schwarze [Mon, 1 Jul 2019 22:56:24 +0000 (22:56 +0000)]
delete trailing whitespace and space-tab sequences; no code change;
patch from Michal Nowak <mnowak at startmail dot com>
who found these with git pbchk in the illumos tree

5 years agoFix mandoc_normdate() and the way it is used.
Ingo Schwarze [Thu, 27 Jun 2019 15:07:30 +0000 (15:07 +0000)]
Fix mandoc_normdate() and the way it is used.
In the past, it could return NULL but the calling code wasn't prepared
to handle that.  Make sure it always returns an allocated string.
While here, simplify the code by handling the "quick" attribute
inside mandoc_normdate() rather than at multiple callsites.

Triggered by deraadt@ pointing out
that snprintf(3) error handling was incomplete in time2a().

5 years agoImprove "man -h" output.
Ingo Schwarze [Thu, 27 Jun 2019 12:20:18 +0000 (12:20 +0000)]
Improve "man -h" output.
1. For pages lacking a SYNOPSIS, show the NAME section rather than nothing.
2. Do not print a stray blank before the beginning of a SYNOPSIS.
Both issues reported by, and patch OK'ed by, tb@.

5 years agoDo not access a NULL pointer if a table contains a horizontal line
Ingo Schwarze [Tue, 11 Jun 2019 16:04:36 +0000 (16:04 +0000)]
Do not access a NULL pointer if a table contains a horizontal line
next to a table line having fewer columns than the table as a whole.
Bug found by Stephen Gregoratto <dev at sgregoratto dot me>
with aerc-config(5).

5 years agoExplicitly state that the cases in the inner switch in term_fill()
Ingo Schwarze [Mon, 3 Jun 2019 20:23:41 +0000 (20:23 +0000)]
Explicitly state that the cases in the inner switch in term_fill()
are exhaustive.  While there is no bug, being explicit has no downside
is is potentially safer for the future.

Michal Nowak <mnowak at startmail dot com> reported that gcc 4.4.4
and 7.4.0 on illumos throw -Wuninitialized false positives.

5 years agoInitialize the local variable "lastln" in mparse_buf_r().
Ingo Schwarze [Mon, 3 Jun 2019 19:58:02 +0000 (19:58 +0000)]
Initialize the local variable "lastln" in mparse_buf_r().
While there is no bug, it logically makes sense given the meaning
of the variable that lastln is NULL as long as firstln is NULL.

Michal Nowak <mnowak at startmail dot com> reported that gcc 4.4.4
and 7.4.0 on illumos throw -Wuninitialized false positives.

5 years agoInitialize the local variable "act" in print_mdoc_node().
Ingo Schwarze [Mon, 3 Jun 2019 19:50:33 +0000 (19:50 +0000)]
Initialize the local variable "act" in print_mdoc_node().
While there is no bug, it helps clarity, and it is also safer in this
particular code because in case a bug gets introduced later, accessing
a NULL pointer is less dangerous than accessing an uninitialized pointer.

Michal Nowak <mnowak at startmail dot com> reported that gcc 4.4.4
and 7.4.0 on illumos throw -Wuninitialized false positives.

5 years agoSupport prefers-color-scheme: dark.
Ingo Schwarze [Sun, 2 Jun 2019 16:57:13 +0000 (16:57 +0000)]
Support prefers-color-scheme: dark.
The :visited rule was contributed by <Armin at Besirovic dot com>.
Guidance and OK tj@.

5 years agouse proper crossreference; patch from naddy@
Ingo Schwarze [Sun, 26 May 2019 01:28:09 +0000 (01:28 +0000)]
use proper crossreference; patch from naddy@

5 years agoDo not print the style message "missing date" when the date is given
Ingo Schwarze [Tue, 21 May 2019 08:04:21 +0000 (08:04 +0000)]
Do not print the style message "missing date" when the date is given
as "$Mdocdate$" without an actual date.  That is the canonical way to
write a new manual page and not bad style at all.
Misleading message reported by kn@ on tech@.

5 years agosocppc makes an extended visit to the bigbucket;
Ingo Schwarze [Tue, 21 May 2019 07:52:00 +0000 (07:52 +0000)]
socppc makes an extended visit to the bigbucket;
patch from deraadt@; OK kettenis

5 years agoavoid duplicate "bad argument" error message, also shortening the code
Ingo Schwarze [Fri, 3 May 2019 18:39:34 +0000 (18:39 +0000)]
avoid duplicate "bad argument" error message, also shortening the code

5 years agowhen processing unknown output options, prevent passing NULL to printf;
Ingo Schwarze [Fri, 3 May 2019 18:23:53 +0000 (18:23 +0000)]
when processing unknown output options, prevent passing NULL to printf;
patch from anton@

5 years agoEnter dangling .so links into the database, to avoid harassing
Ingo Schwarze [Fri, 3 May 2019 18:17:12 +0000 (18:17 +0000)]
Enter dangling .so links into the database, to avoid harassing
users of man(1) about running makewhatis(8), which won't help.
Seeing the content of the broken .so request might even help
users to figure out how to access the manual page they want.

Fixing the last issue reported by Lorenzo Beretta <loreb at github>
as part of https://github.com/void-linux/void-packages/issues/9868 .

5 years agoIn fs_lookup(), use stat(2) rather than access(2) to check file existence.
Ingo Schwarze [Fri, 3 May 2019 17:31:15 +0000 (17:31 +0000)]
In fs_lookup(), use stat(2) rather than access(2) to check file existence.
Some mildly broken real-world packages on some operating systems
contain dangling symlinks in manual page directories: pestering the
user to run makewhatis(8) makes no sense because that won't help.
On the other hand, missing read permissions deserve ugly error messages
and are unlikely to occur in practice anyway.

Fixing an issue reported by Lorenzo Beretta <loreb at github>
as part of https://github.com/void-linux/void-packages/issues/9868 .

5 years agoIn man(1) mode with a specific section requested,
Ingo Schwarze [Fri, 3 May 2019 16:14:41 +0000 (16:14 +0000)]
In man(1) mode with a specific section requested,
try harder to find the best match.

Use this order of preference:
1. The section in both the directory name and the file name matches exactly.
2. The section in the file name matches exactly.
3. The section in the directory name matches exactly.
4. Neither of them matches exactly.
The latter can happen when mansearch() finds substring matches
or when the second .Dt argument mismatches the dir and file names.

Lorenzo Beretta <loreb at github> reported that this caused real
problems on Void Linux, like "man 3 readline" showing readline(3m).
See https://github.com/void-linux/void-packages/issues/9868 for details.

5 years agoIn man(1) mode, when the first argument starts with a digit,
Ingo Schwarze [Fri, 3 May 2019 09:39:25 +0000 (09:39 +0000)]
In man(1) mode, when the first argument starts with a digit,
optionally followed by a letter, and at least one more argument
follows, interpret the first argument as a section name even when
additional characters follow after the digit and letter.

This is needed because many operating systems have section names
consisting of a digit followed by more than one letter - for example
Illumos, Solaris, Linux, even NetBSD.

There is very little risk of regressions: in the whole corpus of
manual pages on man.openbsd.org, there isn't a single manual page
name starting with a digit.  And even if programs like "0ad" or
"4channels" had manual pages, "man 0ad" and "man -a cat 0ad" would
still work, only "man -a 0ad cat" will fail with "man: No entry for
cat in section 0ad of the manual."

Fixing one of the issues reported by Lorenzo Beretta <loreb at github>
as part of https://github.com/void-linux/void-packages/issues/9868 .

5 years agoIn man(1) mode, i.e. when asking for a single manual page by name,
Ingo Schwarze [Tue, 30 Apr 2019 18:51:57 +0000 (18:51 +0000)]
In man(1) mode, i.e. when asking for a single manual page by name,
prefer file name matches over .Dt/.TH matches over first NAME matches
over later NAME matches, but do not change the ordering for apropos(1)
nor for man -a.

This reverts main.c rev. 1.310 and mansearch.h rev. 1.29
and includes a partial revert of mansearch.c rev. 1.79.

Regression reported by Lorenzo Beretta <loreb at github>
as part of https://github.com/void-linux/void-packages/issues/9868 .

5 years agoIn HTML output, allow switching the desired font for subsequent
Ingo Schwarze [Tue, 30 Apr 2019 15:53:00 +0000 (15:53 +0000)]
In HTML output, allow switching the desired font for subsequent
text without printing an opening tag right away, and use that in
the .ft request handler.  While here, garbage collect redundant
enum htmlfont and reduce code duplication in print_text().
Fixing an assertion failure reported by Michael <Stapelberg at Debian>
in pmRegisterDerived(3) from libpcp3-dev.

5 years agoimprove the description of the message "blank line in fill mode";
Ingo Schwarze [Tue, 30 Apr 2019 11:48:10 +0000 (11:48 +0000)]
improve the description of the message "blank line in fill mode";
triggered by a misunderstanding by sashan@

5 years agoclarify the difference between .Cm and .Ic;
Ingo Schwarze [Wed, 24 Apr 2019 13:15:00 +0000 (13:15 +0000)]
clarify the difference between .Cm and .Ic;
triggered by a question from Fabio Scotoni

5 years agoclarify how .%P is conventionally used;
Ingo Schwarze [Tue, 23 Apr 2019 18:46:06 +0000 (18:46 +0000)]
clarify how .%P is conventionally used;
triggered by a question from Fabio Scotoni <fabio at esse dot ch>

5 years agoadd missing "pp." to .%P macro;
Ingo Schwarze [Tue, 23 Apr 2019 17:57:49 +0000 (17:57 +0000)]
add missing "pp." to .%P macro;
reported by Fabio Scotoni <fabio at esse dot ch>

5 years agoissues found by Jan Stary in groffer(1) version 1.19
Ingo Schwarze [Tue, 23 Apr 2019 11:43:24 +0000 (11:43 +0000)]
issues found by Jan Stary in groffer(1) version 1.19

5 years agoWhen calling an empty macro, do not clobber existing arguments.
Ingo Schwarze [Sun, 21 Apr 2019 23:51:21 +0000 (23:51 +0000)]
When calling an empty macro, do not clobber existing arguments.
Fixing a bug found with the groffer(1) version 1.19 manual page
following a report from Jan Stary.

5 years agoImplement the roff .break request (break out of a .while loop).
Ingo Schwarze [Sun, 21 Apr 2019 22:48:58 +0000 (22:48 +0000)]
Implement the roff .break request (break out of a .while loop).
Jan Stary <hans at stare dot cz> found it in an ancient groffer(1)
manual page (version 1.19) on MacOS X Mojave.
Having .break not implemented wasn't a particularly bright idea
because obviously, it tended to cause infinite loops.

5 years agonew man(1) issues from Lorenzo Beretta <loreb at github>
Ingo Schwarze [Mon, 1 Apr 2019 15:57:29 +0000 (15:57 +0000)]
new man(1) issues from Lorenzo Beretta <loreb at github>

5 years agoWhile we do encourage simplicity in the sense of writing plain '-'
Ingo Schwarze [Sun, 31 Mar 2019 19:17:26 +0000 (19:17 +0000)]
While we do encourage simplicity in the sense of writing plain '-'
for hyphen-minus, soften the language a bit: writing \- for it is
not wrong, and people started sending us patches to replace \- with '-'
in existing manual pages, which is not a worthwhile change unless
the \- is used at a place where it doesn't belong.
OK jmc@

5 years agoSet the maximum column index in a tbl(7) to the maximum *right* edge
Ingo Schwarze [Fri, 29 Mar 2019 21:27:06 +0000 (21:27 +0000)]
Set the maximum column index in a tbl(7) to the maximum *right* edge
of any cell span, not to the maximum *left* edge, which may be smaller
if the last column of the table is only reached by horizontal spans,
but not by any regular cell in any row of the table.
Otherwise, the algorithm calculating column widths accessed memomy
after the end of the colwidth[] array, while it was trying to handle
the rightmost column(s).

Crash reported by Jason Thorpe <thorpej at NetBSD>
via https://gnats.netbsd.org/cgi-bin/query-pr-single.pl?number=54069
and via Thomas Klausner (wiz@).
Christos@ Zoulas sent a (correct, but slightly confusing) patch.
The patch i'm committing here is easier to understand.

5 years agoWhen the last line of the input is empty and the previous line reduced
Ingo Schwarze [Tue, 19 Mar 2019 16:26:08 +0000 (16:26 +0000)]
When the last line of the input is empty and the previous line reduced
the line input buffer to a length of one byte, do not write one byte
past the end of the line input buffer.  Minimal code to show the bug:
printf ".ds X\n.X\n\n" | MALLOC_OPTIONS=C mandoc
Bug found by bentley@ in the sysutils/rancid par(1) manual page.

5 years agofix a NULL pointer access on empty tbl(7) data cells
Ingo Schwarze [Mon, 18 Mar 2019 08:00:34 +0000 (08:00 +0000)]
fix a NULL pointer access on empty tbl(7) data cells
that bentley@ found in syncthing-bep(7)

5 years agoThe header file "html.h" uses enum roff_tok,
Ingo Schwarze [Sun, 17 Mar 2019 18:21:45 +0000 (18:21 +0000)]
The header file "html.h" uses enum roff_tok,
so "roff.h" must be included before it.
Diff from bcallah@ tweaked by me;
he found the bug by compiling with pcc.

5 years agoWhen drawing a horizontal line in tbl(7) UTF-8 output, it is not
Ingo Schwarze [Sat, 16 Mar 2019 21:35:48 +0000 (21:35 +0000)]
When drawing a horizontal line in tbl(7) UTF-8 output, it is not
sufficient to look at two data rows, but up to three are needed:
the one above to identify vertical lines branching off upward, the
row itself (in case the line is in a data row rather than a layout
line) to figure out the horizontal line style, and the row below
to identify vertical lines branching off downward.

As an example, bentley@ reported from the mpv(1) manual page that
in a tbl(7) having a vertical line in the middle and a horizontal
line in the bottom data row, the vertical line extended below the
bottom horizontal line.

5 years agoContrary to what the NetBSD attribute(3) manual page suggests,
Ingo Schwarze [Wed, 13 Mar 2019 18:29:18 +0000 (18:29 +0000)]
Contrary to what the NetBSD attribute(3) manual page suggests,
using __dead instead of __attribute__((__noreturn__)) actually
hinders portability rather than helping it.

Given that mandoc already uses __attribute__ in several files
and that in the portable version, ./configure already contains
rudimentary support for ignoring it on platforms that do not
support it, use __attribute__ directly.

This is expected to fix build failures that Stephen Gregoratto
<dev at sgregoratto dot me> reported from Arch and Debian Linux.

5 years agomark check_abort() and post_abort() as __dead;
Ingo Schwarze [Mon, 11 Mar 2019 13:21:11 +0000 (13:21 +0000)]
mark check_abort() and post_abort() as __dead;
based on a patch by Christos@ Zoulas at NetBSD

5 years agorelease 1.14.5 VERSION_1_14_5
Ingo Schwarze [Sun, 10 Mar 2019 09:32:00 +0000 (09:32 +0000)]
release 1.14.5

5 years agoAutomatically detect whether diff(1) supports the -a option.
Ingo Schwarze [Sun, 10 Mar 2019 09:23:33 +0000 (09:23 +0000)]
Automatically detect whether diff(1) supports the -a option.
Useful on illumos and on Oracle Solaris, where it doesn't.
Patch written based on a report from Sevan Janiyan.

5 years agoMention mandoc.db(5), makewhatis(8), and weekly(8).
Ingo Schwarze [Sat, 9 Mar 2019 15:55:01 +0000 (15:55 +0000)]
Mention mandoc.db(5), makewhatis(8), and weekly(8).
Omission noticed by espie@ long ago, and wording tweaked by jmc@.

5 years agonew dist-install maintainer target
Ingo Schwarze [Wed, 6 Mar 2019 16:08:41 +0000 (16:08 +0000)]
new dist-install maintainer target

5 years agowhile $() is more modern than ``, it does not work with the
Ingo Schwarze [Wed, 6 Mar 2019 16:04:31 +0000 (16:04 +0000)]
while $() is more modern than ``, it does not work with the
default /bin/sh on Solaris 10, so use the classical form

5 years agomention Solaris BUGS in regress.pl(1)
Ingo Schwarze [Wed, 6 Mar 2019 15:58:10 +0000 (15:58 +0000)]
mention Solaris BUGS in regress.pl(1)

5 years agothis file needs to #include "config.h" because it calls getprogname();
Ingo Schwarze [Wed, 6 Mar 2019 15:55:38 +0000 (15:55 +0000)]
this file needs to #include "config.h" because it calls getprogname();
found while testing on Debian jessie

5 years agodrop redundant '0' flag from "%02.2X" format string;
Ingo Schwarze [Wed, 6 Mar 2019 12:32:41 +0000 (12:32 +0000)]
drop redundant '0' flag from "%02.2X" format string;
found by a compiler warning from gcc 4.9.2 on Linux

5 years agowork towards 1.14.5, mostly updating WWW_INCS
Ingo Schwarze [Wed, 6 Mar 2019 11:19:42 +0000 (11:19 +0000)]
work towards 1.14.5, mostly updating WWW_INCS

5 years agoadd arch.o
Ingo Schwarze [Wed, 6 Mar 2019 11:11:01 +0000 (11:11 +0000)]
add arch.o

5 years agodraft 1.14.5 NEWS entry
Ingo Schwarze [Wed, 6 Mar 2019 10:22:57 +0000 (10:22 +0000)]
draft 1.14.5 NEWS entry

5 years agoautoconfiguration test whether less(1) supports the -T option;
Ingo Schwarze [Wed, 6 Mar 2019 10:18:58 +0000 (10:18 +0000)]
autoconfiguration test whether less(1) supports the -T option;
needed for Alpine Linux because it uses busybox less(1) by default;
based on a patch from Daniel Sabogal explained to me by Natanael Copa

5 years agoFor TIOCGWINSZ, #include <termios.h> rather than <sys/termios.h>
Ingo Schwarze [Mon, 4 Mar 2019 18:15:06 +0000 (18:15 +0000)]
For TIOCGWINSZ, #include <termios.h> rather than <sys/termios.h>
like almost all other userland programs.  This also improves
portability: for example, it looks like <sys/termios.h> does not
work on FreeBSD, or at least bapt@ did the same change over there.

5 years agoadd libbe; from kevans@ via FreeBSD rev. 337663
Ingo Schwarze [Mon, 4 Mar 2019 17:35:21 +0000 (17:35 +0000)]
add libbe; from kevans@ via FreeBSD rev. 337663

5 years agoWhen the -S option is given to man(1) and the requested manual page
Ingo Schwarze [Mon, 4 Mar 2019 13:01:57 +0000 (13:01 +0000)]
When the -S option is given to man(1) and the requested manual page
name is not found and the requested architecture is unknown, complain
about the architecture rather than about the manual page name:

$ man -S vax cpu
man: Unknown architecture "vax".
$ man -S sparc64 foobar
man: No entry for foobar in the manual.

Friendlier error message suggested by jmc@, who also OK'ed the patch.

5 years agoFix the last straggler where the struct roff_node "line" member
Ingo Schwarze [Mon, 4 Mar 2019 11:40:09 +0000 (11:40 +0000)]
Fix the last straggler where the struct roff_node "line" member
was abused to detect an input line break;
instead, use the NODE_LINE flag to improve robustness.

5 years agoadditional comments on two TODO items
Ingo Schwarze [Mon, 4 Mar 2019 11:37:30 +0000 (11:37 +0000)]
additional comments on two TODO items

5 years agoReset HTML formatter state, in particular the id_unique hash,
Ingo Schwarze [Sun, 3 Mar 2019 13:02:11 +0000 (13:02 +0000)]
Reset HTML formatter state, in particular the id_unique hash,
after processing each manual page, such that the next page
starts from a clean state and doesn't continue suffix numbering.

Issue found while looking at https://github.com/Debian/debiman/issues/48
which was brought up by Orestis Ioannou <oorestisime at github>.

5 years agoadd forgotten mparse options to two rarely used programs
Ingo Schwarze [Sun, 3 Mar 2019 11:01:15 +0000 (11:01 +0000)]
add forgotten mparse options to two rarely used programs

5 years agoDo not open a subsection for each and every macro.
Ingo Schwarze [Sat, 2 Mar 2019 22:04:40 +0000 (22:04 +0000)]
Do not open a subsection for each and every macro.
Instead, use a tagged list and the canonical .Ic macro
as it is natural for such purposes.
While here, also delete heaps of needless escaping.

5 years agoremove a few words to improve flow; from tedu@
Ingo Schwarze [Sat, 2 Mar 2019 21:03:02 +0000 (21:03 +0000)]
remove a few words to improve flow; from tedu@

5 years agoRepresent multiple subsequent .IP blocks having a consistent
Ingo Schwarze [Sat, 2 Mar 2019 16:30:53 +0000 (16:30 +0000)]
Represent multiple subsequent .IP blocks having a consistent
head argument of *, \-, or \(bu as <ul> rather than as <dl>,
using a bit of heuristics.

Basic idea suggested by Dagfinn Ilmari Mannsaker <ilmari at github>
in https://github.com/Debian/debiman/issues/67 and independently by
<Pali dot Rohar at gmail dot com> on <discuss at mandoc dot bsd dot lv>.

5 years agoWrap .Sh/.SH sections and .Ss/.SS subsections in HTML <section> elements
Ingo Schwarze [Fri, 1 Mar 2019 10:57:17 +0000 (10:57 +0000)]
Wrap .Sh/.SH sections and .Ss/.SS subsections in HTML <section> elements
as recommended for accessibility by the HTML 5 standard.
Triggered by a similar, but slightly different suggestion
from Laura Morales <lauretas at mail dot com>.

5 years agoFormat multiple subsequent .IP or multiple subsequent .TP/.TQ
Ingo Schwarze [Thu, 28 Feb 2019 16:36:13 +0000 (16:36 +0000)]
Format multiple subsequent .IP or multiple subsequent .TP/.TQ
as a single <dl> list rather than opening a new list for each item;
feature suggested by Pali dot Rohar at gmail dot com.

5 years agoExplain the ASCII rendering of single quotes because that repeatedly
Ingo Schwarze [Sat, 23 Feb 2019 18:53:54 +0000 (18:53 +0000)]
Explain the ASCII rendering of single quotes because that repeatedly
caused confusion in the past.  People plainly do not expect that
there are limits to the compatibility between Unicode and ASCII,
but there are.

The information belongs here and not into mandoc_char(7) because
it explains how the specific output device (-T ascii) works and
because it has nothing to do with the question of how characters
are represented on the input side.

5 years agoThe horizontal line in a data cell containing only "_" or "="
Ingo Schwarze [Sat, 9 Feb 2019 21:02:47 +0000 (21:02 +0000)]
The horizontal line in a data cell containing only "_" or "="
connects to the horizontally adjacent vertical line or cell;
fixing a bug reported by bentley@.

5 years agoadd a BUGS section explaining the situation with box and line drawing
Ingo Schwarze [Sat, 9 Feb 2019 16:46:13 +0000 (16:46 +0000)]
add a BUGS section explaining the situation with box and line drawing
in UTF-8 output; suggested by bentley@

5 years agoignore empty request lines in the table data reader;
Ingo Schwarze [Sat, 9 Feb 2019 16:00:39 +0000 (16:00 +0000)]
ignore empty request lines in the table data reader;
fixing a minibug reported by bentley@

5 years agofix typo: "a data cells" -> "a data cell"; from bentley@
Ingo Schwarze [Fri, 8 Feb 2019 22:51:53 +0000 (22:51 +0000)]
fix typo: "a data cells" -> "a data cell"; from bentley@

5 years agostyle improvement from jmc@, no output change;
Ingo Schwarze [Thu, 7 Feb 2019 15:45:53 +0000 (15:45 +0000)]
style improvement from jmc@, no output change;
original commit message:
.Pp
.Bd ... -compact

is better written as

.Bd ...

5 years agoRemove the misleading statement ".No takes no arguments".
Ingo Schwarze [Wed, 6 Feb 2019 22:18:59 +0000 (22:18 +0000)]
Remove the misleading statement ".No takes no arguments".
In facts, i works very similarly to .Em and .Sy.
Triggered by a question from Kurt Mosiejczuk <kurt at cranky dot work>.

5 years agoLet roff_getname() end the roff identifier at a tab character
Ingo Schwarze [Wed, 6 Feb 2019 21:11:43 +0000 (21:11 +0000)]
Let roff_getname() end the roff identifier at a tab character
and audit all its callers whether termination is handled correctly.

Resulting improvements:
* An escape or tab ending the macro name in a macro invocation
is discarded, and argument processing is started after it.
* An escape or tab ending a name in ".if d" and ".if r" is preserved.
* An escape ending a name in ".ds" causes the whole request to be ignored.
* A tab ending a name in ".ds" becomes part of the string.
* An escape or tab ending a name in ".rm"
causes the rest of the line to be ignored.
* An escape or tab ending the first name in ".als", ".rn", or ".nr"
causes the whole request to be ignored.

Kurt Jaeger <pi at FreeBSD> made me aware of
  https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=235456#c0
and in that bug report, comment 0 item (3) is a special case
of this class of issues.

Yes, the "mh" manual pages are no doubt among the worst on the planet.

5 years agoadjust style and comments in roff_getname(); no functional change
Ingo Schwarze [Wed, 6 Feb 2019 17:40:13 +0000 (17:40 +0000)]
adjust style and comments in roff_getname(); no functional change

5 years agoRelax overzealous PATH_INFO validation.
Ingo Schwarze [Thu, 31 Jan 2019 23:00:23 +0000 (23:00 +0000)]
Relax overzealous PATH_INFO validation.
URIs like https://man.openbsd.org/OpenBSD-2.2/cat1/cat.0
are still required to work because they result from apropos searches for
old releases (up to 5.0) which used to install preformatted manual pages.
Regression reported by jj@.

5 years agoSince resetting of offsets works quite differently in man(7) and mdoc(7),
Ingo Schwarze [Thu, 31 Jan 2019 16:31:55 +0000 (16:31 +0000)]
Since resetting of offsets works quite differently in man(7) and mdoc(7),
test table centering in an mdoc(7) document as well.
Related to tbl_term.c rev. 1.67.

5 years agoFix tbl(7) centering in mdoc(7) documents.
Ingo Schwarze [Thu, 31 Jan 2019 16:06:22 +0000 (16:06 +0000)]
Fix tbl(7) centering in mdoc(7) documents.

Since resetting of offsets works quite differently in the mdoc(7)
and man(7) formatters, the tbl(7) formatter needs to save the global
offset on entry and restore it on exit.  The additional indentation
needed for table centering has to be added to its own offset variable
and applied to each line of the table, rather than only to the first.

Bug found by bentley@ in emulators/fceux(6).

5 years agoThe .UR and .MT blocks in man(7) are represented by <a> elements
Ingo Schwarze [Fri, 18 Jan 2019 14:36:21 +0000 (14:36 +0000)]
The .UR and .MT blocks in man(7) are represented by <a> elements
which establish phrasing context, but they can contain paragraph
breaks (which is relevant for terminal formatting, so we can't just
change the structure of the syntax tree), which are respresented
by <p> elements and cannot occur inside <a>.

Fix this by prematurely closing the <a> element in the HTML formatter.
This menas that the clickable text in HTML output is shorter than
what is represented as the link text in terminal output, but in
HTML, it is frankly impossible to have the clickable area of a
hyperlink extend across a paragraph break.  The difference in
presentation is not a major problem, and besides, paragraph breaks
inside .UR are rather poor style in the first place.

The implementation is quite tricky.  Naively closing out the <a>
prematurely would result in accessing a stale pointer when later
reaching the physical end of the .UR block.  So this commit separates
visual and structural closing of "struct tag" stack items.  Visual
closing means that the HTML element is closed but the "struct tag"
remains on the stack, to avoid later access to a stale pointer and
to avoid closing the same HTML element a second time later.

This also needs reference counting of pointers to "struct tag" stack
items because often more than one child holds a pointer to the same
parent item, and only the outermost child can safely do the physical
closing.

In the whole corpus of nearly half a million manual pages on
man.openbsd.org, this problem occurs in exactly one page: the
groff(1) version 1.20.1 manual contained in DragonFly-3.8.2, which
contains a formatting error triggering the bug.

6 years agoDelete several entries that were already fixed.
Ingo Schwarze [Thu, 17 Jan 2019 08:14:38 +0000 (08:14 +0000)]
Delete several entries that were already fixed.
The two entries about dashes, hyphens, and minus signs are no longer
relevant because we decided on a policy that is now documented.

6 years agoTest handling of escaped backslashes because the code related to
Ingo Schwarze [Thu, 17 Jan 2019 06:33:35 +0000 (06:33 +0000)]
Test handling of escaped backslashes because the code related to
copy mode is complicated and prone to regressions.

6 years agoIn PostScript and PDF output, one AFM unit is not nearly enough
Ingo Schwarze [Tue, 15 Jan 2019 12:16:18 +0000 (12:16 +0000)]
In PostScript and PDF output, one AFM unit is not nearly enough
inter-word spacing, let's try again with 250 AFM units.
Regression caused during my recent term_flushln() reorg in rev. 1.278,
reported by brynet@ (sorry and many thanks for reporting).

6 years agoImprove error reporting when a file given on the command line
Ingo Schwarze [Fri, 11 Jan 2019 17:04:44 +0000 (17:04 +0000)]
Improve error reporting when a file given on the command line
cannot be opened:
* Mention the filename.
* Report the errno for the file itself, not the one with .gz appended.

6 years agodo not access a NULL pointer when formatting a completely empty document
Ingo Schwarze [Fri, 11 Jan 2019 16:36:19 +0000 (16:36 +0000)]
do not access a NULL pointer when formatting a completely empty document

6 years agoRemove the HTML title= attributes which harmed accessibility and
Ingo Schwarze [Fri, 11 Jan 2019 12:56:42 +0000 (12:56 +0000)]
Remove the HTML title= attributes which harmed accessibility and
violated the principle of separation of content and presentation.
Instead, implement the tooltips purely in CSS.
Thanks to John Gardner <gardnerjohng at gmail dot com> for
suggesting most of the styling in the new ::before rules.

6 years agoAfter years of gnashing of teeth, i finally found a way to avoid
Ingo Schwarze [Thu, 10 Jan 2019 07:40:10 +0000 (07:40 +0000)]
After years of gnashing of teeth, i finally found a way to avoid
having to write empty list elements for non-compact .Bl -tag lists:

1. Add margin-bottom to the <dd>.
Note that margin-top on the <dt> doesn't work because it would put
a short <dt> lower than the <dd>; margin-bottom on the <dt> doesn't
work because it would put vertical space before the <dd> for a long
<dt>; and margin-top on the <dd> doesn't work because it would put
a short <dt> higher than the <dd>.  Only margin-bottom on the <dd>
has none of these adverse effects.

2. Of course, margin-bottom on the <dd> fails to take care of the
vertical spacing before the first list element, so implement that
separately by margin-top on the <dl>.

3. For .Bl -tag -compact, reset both to zero.

6 years agoInitializers for file-scope static variables should be compile-time
Ingo Schwarze [Thu, 10 Jan 2019 06:29:00 +0000 (06:29 +0000)]
Initializers for file-scope static variables should be compile-time
constants, and while stderr is a compile-time constant in OpenBSD,
Kelvin Sherlock <ksherlock at gmail dot com> reports that it isn't
on some other systems, for example on FreeBSD or Linux.
So do the initialization by calling mandoc_msg_setoutfile()
from main() instead.

6 years agoRepresent mdoc(7) .Pp (and .sp, and some SYNOPSIS and .Rs features)
Ingo Schwarze [Mon, 7 Jan 2019 07:26:29 +0000 (07:26 +0000)]
Represent mdoc(7) .Pp (and .sp, and some SYNOPSIS and .Rs features)
by the <p> HTML element and use the html_fillmode() mechanism
for .Bd -unfilled, just like it was done for man(7) earlier, finally
getting rid both of the horrible <div class="Pp"></div> hack and
of the worst HTML syntax violations caused by nested displays.

Care is needed because in some situations, paragraphs have to remain
open across several subsequent macros, whereas in other situations,
they must get closed together with a block containing them.

Some implementation details include:
* Always close paragraphs before emitting HTML flow content.
* Let html_close_paragraph() also close <pre> for extra safety.
* Drop the old, now unused function print_paragraph().
* Minor adjustments in the top-level man(7) node formatter for symmetry.
* Bugfix: .Ss heads suspend no-fill mode, even though .Ss doesn't end it.
* Bugfix: give up on .Op semantic markup for now, see the comment.

6 years agoFinally, represent the man(7) .PP and .HP macros by the natural
Ingo Schwarze [Sun, 6 Jan 2019 04:55:09 +0000 (04:55 +0000)]
Finally, represent the man(7) .PP and .HP macros by the natural
choice, which is the <p> HTML element.  On top of the previous
fill-mode improvements, the key to making this possible is to
automatically close the <p> when required: before headers, subsequent
paragraphs, lists, indented blocks, synopsis blocks, tbl(7) blocks,
and before blocks using no-fill mode.

In man(7) documents, represent the .sp request by a blank line in
no-fill mode and in the same way as .PP in fill mode.

6 years agoIn no-fill mode, avoid bogus blank lines in two situations:
Ingo Schwarze [Sat, 5 Jan 2019 21:55:11 +0000 (21:55 +0000)]
In no-fill mode, avoid bogus blank lines in two situations:
1. After the last child; the parent will take care of the line break.
2. At the .YS macro; the end of the preceding .SY already broke the line.

6 years agoIn groff, when the .SY block macro occurs in no-fill mode,
Ingo Schwarze [Sat, 5 Jan 2019 21:18:26 +0000 (21:18 +0000)]
In groff, when the .SY block macro occurs in no-fill mode,
the output line gets broken after the head.  Do the same.

6 years agoSlowly start doing more HTML output tests, in this case for the
Ingo Schwarze [Sat, 5 Jan 2019 20:04:50 +0000 (20:04 +0000)]
Slowly start doing more HTML output tests, in this case for the
interaction of .nf and .RS, related to man_macro.c rev. 1.106.

HTML regression testing is tricky because it is extremely prone to
over-testing, i.e. unintentional testing for volatile formatting
details which are irrelevant for deciding whether the HTML output
is good or bad.  Minor changes to the formatter - which is still
heavily under development - might result in the necessity to
repeatedly adjust many test cases.

Then again, HTML syntax rules are so complicated that without
regression testing, the risk is simply too high that later changes
will re-introduce issues that were already fixed earlier.  Let's
just try to design the tests very carefully in such a way that
the *.out_html files contain nothing that is likely to change, and
defer testing in cases where the HTML output is not yet clean enough
to allow designing tests in such a way.

6 years agoIn HTML output, man(7) .RS blocks get formatted as <div class="Bd-indent">,
Ingo Schwarze [Sat, 5 Jan 2019 18:59:46 +0000 (18:59 +0000)]
In HTML output, man(7) .RS blocks get formatted as <div class="Bd-indent">,
and i can see no reasonable alternative: they do indeed represent indented
displays.  They certainly require flow context and make no sense in phrasing
context.  Consequently, they have to suspend no-fill mode during their head,
in just the same way as other paragraph-type macros do it.

This fixes HTML syntax errors that resulted from .nf followed by .RS.

6 years agominor cleanup, no functional change:
Ingo Schwarze [Sat, 5 Jan 2019 09:46:34 +0000 (09:46 +0000)]
minor cleanup, no functional change:
* delete one irrelevant FIXME; no more fixed lengths in HTML, please
* simplify some conditions
* avoid testing pointers as truth values, use "!= NULL"
* sort some declarations
* delete some pointless blank lines

6 years agoNow that the NODE_NOFILL flag in the syntax tree is accurate,
Ingo Schwarze [Sat, 5 Jan 2019 09:14:44 +0000 (09:14 +0000)]
Now that the NODE_NOFILL flag in the syntax tree is accurate,
use it in the man(7) HTML formatter rather than keeping fill mode
state locally, resulting in massive simplification (minus 40 LOC).

Move the html_fillmode() state handler function to the html.c module
such that both the man(7) and the roff(7) formatter (and in the future,
also the mdoc(7) formatter) can use it.  Give it a query mode, to be
invoked with TOKEN_NONE.