]> git.cameronkatri.com Git - mandoc.git/log
mandoc.git
3 years agotypo; diff from fcambus@
Ingo Schwarze [Wed, 12 May 2021 08:51:01 +0000 (08:51 +0000)]
typo; diff from fcambus@

3 years ago\s with arbitrary arg delimiters
Ingo Schwarze [Wed, 12 May 2021 08:34:46 +0000 (08:34 +0000)]
\s with arbitrary arg delimiters

3 years agoIn HTML output, correctly render .Bd -unfilled in proportionally-spaced
Ingo Schwarze [Tue, 30 Mar 2021 19:26:20 +0000 (19:26 +0000)]
In HTML output, correctly render .Bd -unfilled in proportionally-spaced
font, rather than with the monospace font appropriate for .Bd -literal.
This fixes a minibug reported by anton@.

Implemented by no longer relying on the typical browser default of
"pre { font-family: monospace }" but instead letting <pre> elements
inherit the font family from their parent, then adding an explicit CSS .Li
class only for those displays where the manual page author requested it
by using the -literal option on the .Bd macro.

3 years agoAppend .html suffix to temporary files enabling browsers to recognise it.
Ingo Schwarze [Tue, 30 Mar 2021 17:16:55 +0000 (17:16 +0000)]
Append .html suffix to temporary files enabling browsers to recognise it.

Occasionally one might read a manual page in a webbrowser, e.g.
"MANPAGER=firefox man -T html jq", however temporary files created for
pagers lack file extensions and most web browsers are unable to detect a
file's content without it.

Special case mandoc(1)'s HTML output format by appending the ".html" suffix
to file names such that browsers will actually render HTML as such instead
of showing it as plain text.

Idea and patch from kn@, with minor help from me.

3 years agodouble .TH in man(7)
Ingo Schwarze [Sun, 28 Mar 2021 18:45:43 +0000 (18:45 +0000)]
double .TH in man(7)

3 years agomore about .Bd -unfilled
Ingo Schwarze [Sun, 28 Mar 2021 15:33:34 +0000 (15:33 +0000)]
more about .Bd -unfilled

4 years agoRename syntax test of the \O escape sequence (suppress output groff
Ingo Schwarze [Mon, 21 Dec 2020 15:13:09 +0000 (15:13 +0000)]
Rename syntax test of the \O escape sequence (suppress output groff
extension; mandoc only implements syntax checking but ignores the
sequence) to please Bill Gates and didickman@: avoid path names that
only differ by case, like o.in vs. O.in.

4 years agoMANWIDTH
Ingo Schwarze [Fri, 13 Nov 2020 11:24:37 +0000 (11:24 +0000)]
MANWIDTH

4 years agoold groff_char(7) reported by kamil at NetBSD
Ingo Schwarze [Thu, 12 Nov 2020 20:46:28 +0000 (20:46 +0000)]
old groff_char(7) reported by kamil at NetBSD

4 years agoDelete a sentence pointing to "the Predefined Strings subsection
Ingo Schwarze [Sat, 31 Oct 2020 11:45:16 +0000 (11:45 +0000)]
Delete a sentence pointing to "the Predefined Strings subsection
of the roff(7) manual."  Such a subsection does not exist, and i
do not see why it should.  Predefined strings are an obsolete
feature of macro packages, not a feature of the roff language.

4 years agoFinally get rid of the "overflow: auto" property of ".Bl-tag > dd"
Ingo Schwarze [Fri, 30 Oct 2020 21:34:30 +0000 (21:34 +0000)]
Finally get rid of the "overflow: auto" property of ".Bl-tag > dd"
which has long been know to cause ugly and pointless scroll bars.

Matthew Martin <phy1729 at gmail dot com>
helpfully explained the following two points to me:
1. What we need to do here is establish a new block formatting
context such that the first line of the <dd> content moves down
rather than to the right if the preceding <dt> is wide.
2. A comprehensive list of methods
to establish block formatting context is available in:
https://developer.mozilla.org/en-US/docs/Web/Guide/CSS/Block_formatting_context

In that list, i found that "column-count: 1" does the job.
It is part of CSS Multi-column Layout Level 1.
While that is still in Working Draft status according to
https://www.w3.org/Style/CSS/current-work ,
it is fully supported by all browsers according to
https://developer.mozilla.org/en-US/docs/Web/CSS/column-count ,
probably because it was already part of the second draft of this
standard almost 20 years ago: WD-css3-multicol-20010118.

4 years agoPromote section headers that can can be used unmodified as fragment
Ingo Schwarze [Fri, 30 Oct 2020 13:24:33 +0000 (13:24 +0000)]
Promote section headers that can can be used unmodified as fragment
identifiers from TAG_WEAK to TAG_STRONG,
such that for example ...#DESCRIPTION always works.
Suggested by Aman Verma on the discuss@ list.

4 years agoCorrect an embarrassing spelling mistake:
Ingo Schwarze [Wed, 28 Oct 2020 21:07:47 +0000 (21:07 +0000)]
Correct an embarrassing spelling mistake:
The last name of the author of groff is "Clark".

4 years agoImprove the HISTORY and AUTHORS sections, using information
Ingo Schwarze [Wed, 28 Oct 2020 15:31:37 +0000 (15:31 +0000)]
Improve the HISTORY and AUTHORS sections, using information
received from Douglas McIlroy in private mail:
https://manpages.bsd.lv/history/mcilroy_26_10_2020.txt

4 years agoerror message simplifications requested by deraadt@
Ingo Schwarze [Mon, 26 Oct 2020 13:30:46 +0000 (13:30 +0000)]
error message simplifications requested by deraadt@

4 years agoThe GNU tbl(1) program contained in the groff package internally
Ingo Schwarze [Sun, 25 Oct 2020 18:28:23 +0000 (18:28 +0000)]
The GNU tbl(1) program contained in the groff package internally
uses roff(7) tabulator settings to implement tables, and it used
to leak the changed tabulator settings from tables to the subsequent
roff(7) code.  In mandoc/tbl_term.c rev. 1.54 (June 17, 2017), code
was added to be bug-compatible with groff.

In commit d0e03cf6 (Oct 20, 2020), GNU tbl(1) changed behaviour
to save the tabulator settings before starting a table and restore
them afterwards.  Adjust mandoc for compatibility.

Since mandoc implements tables without using roff(7) tabulator
settings, saving and restoring tabulator settings is not needed in
mandoc.  Simply deleting the code that changed tabulator settings
by reverting tbl_term.c rev. 1.54 is sufficient in mandoc.
Also adjust the desired output of the regression tests
to match the new behaviour of both groff and mandoc.

4 years agoTreat \*[.T] in the same way as \*(.T rather than calling abort(3).
Ingo Schwarze [Sat, 24 Oct 2020 22:57:39 +0000 (22:57 +0000)]
Treat \*[.T] in the same way as \*(.T rather than calling abort(3).
Bug found because the groff-current manual pages started using the
variant form of this predefined string.

4 years agoIn HTML output, avoid printing a newline right after <pre>
Ingo Schwarze [Fri, 16 Oct 2020 17:22:43 +0000 (17:22 +0000)]
In HTML output, avoid printing a newline right after <pre>
and right before </pre> because that resulted in vertical
whitespace not requested by the manual page author.

Formatting bug reported by
Aman Verma <amanraoverma plus vim at gmail dot com> on discuss@.

4 years agoadd missing mention of Werner Lemberg,
Ingo Schwarze [Wed, 14 Oct 2020 14:22:54 +0000 (14:22 +0000)]
add missing mention of Werner Lemberg,
noticed by Werner himself on <groff at gnu dot org>;
while here, add missing .An macros

4 years agoadd example to apropos.1 to list all manuals in a given section;
Ingo Schwarze [Thu, 1 Oct 2020 22:50:00 +0000 (22:50 +0000)]
add example to apropos.1 to list all manuals in a given section;
patch from ians@

4 years agoElement next-line scopes can nest. Consequently, even when closing
Ingo Schwarze [Wed, 9 Sep 2020 17:01:10 +0000 (17:01 +0000)]
Element next-line scopes can nest.  Consequently, even when closing
one element next-line scope, the MAN_ELINE flag must not yet be
cleared if the parent macro is another element macro having next-line
scope, or an assertion failure is caused if all this is wrapped in
another macro that has block next-line scope, for example .TP.
Bug found in an afl run performed by Jan Schreiber <jes at posteo dot de>.

4 years agoDo not abuse assert(3) to react to absurd input; the purpose of assert(3)
Ingo Schwarze [Wed, 9 Sep 2020 13:45:05 +0000 (13:45 +0000)]
Do not abuse assert(3) to react to absurd input; the purpose of assert(3)
only is to catch internal inconsistencies in the program itself.
Issue found in an afl run performed by Jan Schreiber <jes at posteo dot de>.

Instead, just cut down unreasonably wide spacing requested by the document
to a narrower width.

4 years agoassertion found in jes@'es afl run: .TS .if n .ce
Ingo Schwarze [Mon, 7 Sep 2020 14:18:49 +0000 (14:18 +0000)]
assertion found in jes@'es afl run: .TS .if n .ce

4 years agoAfter .ti, there are many reasons why the offset may change, so setting
Ingo Schwarze [Sun, 6 Sep 2020 14:45:22 +0000 (14:45 +0000)]
After .ti, there are many reasons why the offset may change, so setting
it back later requires a guard against underflow, or subsequent assertions
may fail.
Issue found in an afl run performed by Jan Schreiber <jes at posteo dot de>.

4 years agoFix two issues with .po (page offset) formatting:
Ingo Schwarze [Thu, 3 Sep 2020 20:43:15 +0000 (20:43 +0000)]
Fix two issues with .po (page offset) formatting:
1. Truncate excessive offsets to a width reasonable in the context
of manual pages instead of printing excessively long lines
and sometimes causing assertion failures;
found in an afl run performed by Jan Schreiber <jes at posteo dot de>.
2. Remember both the requested and the applied page offset; otherwise,
subtracting an excessive width, then adding it again, would end up
with an incorrectly large offset.
While here, simplify the code by reverting the previous offset up front,
and also add some comments to make the general ideas easier to understand.

4 years agoIf .ti had an excessive argument, using it was attempted, in some
Ingo Schwarze [Thu, 3 Sep 2020 17:42:15 +0000 (17:42 +0000)]
If .ti had an excessive argument, using it was attempted, in some
cases resulting in an assertion failure.  Instead, truncate the
temporary indent to a width reasonable in a manual page.

I found the issue in an afl run
that was performed by Jan Schreiber <jes at posteo dot de>.

4 years agoDo not indent by SIZE_MAX/2 when .ce occurs inside explicit no-fill mode.
Ingo Schwarze [Wed, 2 Sep 2020 16:40:36 +0000 (16:40 +0000)]
Do not indent by SIZE_MAX/2 when .ce occurs inside explicit no-fill mode.
While here, drop two unused arguments from the function term_field();
the related work was already done by term_fill() before this commit.

I found the bug in an afl run
that was performed by Jan Schreiber <jes at posteo dot de>.

4 years agoIgnore unreasonably large spacing modifiers in tbl layouts.
Ingo Schwarze [Tue, 1 Sep 2020 18:25:27 +0000 (18:25 +0000)]
Ignore unreasonably large spacing modifiers in tbl layouts.

Jan Schreiber <jes at posteo dot de> ran afl on mandoc and it turned
out mandoc tried to use spacing modifiers so large that they would
trigger assertion failures in term_ascii.c, function locale_advance().

4 years agomore info from John Gardner about ASCII control chars in roff(7) input
Ingo Schwarze [Tue, 1 Sep 2020 18:10:28 +0000 (18:10 +0000)]
more info from John Gardner about ASCII control chars in roff(7) input

4 years agoRemove a lie reported by Jamie Landeg-Jones <jamie at catflap dot org>:
Ingo Schwarze [Thu, 27 Aug 2020 15:55:34 +0000 (15:55 +0000)]
Remove a lie reported by Jamie Landeg-Jones <jamie at catflap dot org>:
The times when -T man may have expanded .so requests are long gone,
nor would such a feature be useful.  Use soelim(1) if you need that.

4 years agoFix a regression caused by the insertion of two new tokens,
Ingo Schwarze [Thu, 27 Aug 2020 14:59:47 +0000 (14:59 +0000)]
Fix a regression caused by the insertion of two new tokens,
which unintentionally made the -O tag= argument mandatory,
breaking commands like "man -akO tag Ic=ulimit".
Noticed while answering questions from Ian Ropers.

4 years agoMake it more explicit that the statement "-O tag does not work with less(1)"
Ingo Schwarze [Thu, 27 Aug 2020 14:28:11 +0000 (14:28 +0000)]
Make it more explicit that the statement "-O tag does not work with less(1)"
only applies to -T html output mode, and why.  Of course, -O tag works
just fine with less(1) in the -T ascii and -T utf8 output modes.
Potential for confusion pointed out by Ian Ropers.

4 years agoAvoid artifacts in the most common case of closing conditional blocks
Ingo Schwarze [Thu, 27 Aug 2020 12:59:02 +0000 (12:59 +0000)]
Avoid artifacts in the most common case of closing conditional blocks
when no arguments follow the closing brace, \}.
For example, the line "'br\}" contained in the pod2man(1) preamble
would throw a bogus "escaped character not allowed in a name" error.
This issue was originally reported by Chris Bennett on ports@,
and afresh1@ noticed it came from the pod2man(1) preamble.

4 years agoadd a forgotten "#if HAVE_PLEDGE";
Ingo Schwarze [Fri, 7 Aug 2020 20:56:55 +0000 (20:56 +0000)]
add a forgotten "#if HAVE_PLEDGE";
patch sent in by <alexander dot gromnitsky at gmail dot com>
who found the problem the hard way on Fedora 32

4 years agoPut the code handling \} into a new function roff_cond_checkend()
Ingo Schwarze [Mon, 3 Aug 2020 11:02:57 +0000 (11:02 +0000)]
Put the code handling \} into a new function roff_cond_checkend()
and call that function not only from both places where copies
existed - when processing text lines and when processing request/macro
lines in conditional block scope - but also when closing a macro
definition request, such that this construction works:

.if n \{.de macroname
macro content
.. \} ignored arguments
.macroname

This fixes a bug reported by John Gardner <gardnerjohng at gmail dot com>.

While here, avoid a confusing decrement of the line scope counter
in roffnode_cleanscope() for conditional blocks that do not have
line scope in the first place (no functional change for this part).
Also improve validation of an internal invariant in roff_cblock()
and polish some comments.

4 years agotrivial sync with OpenBSD
Ingo Schwarze [Thu, 30 Jul 2020 21:42:27 +0000 (21:42 +0000)]
trivial sync with OpenBSD
in parts of these files that are not used by -portable;
consequently, no functional change

4 years agotrivial adjustment of the desired test results
Ingo Schwarze [Tue, 21 Jul 2020 15:17:21 +0000 (15:17 +0000)]
trivial adjustment of the desired test results
after getting rid of the "copyless" crutch

4 years agoadjust test framework to not require a tty
Ingo Schwarze [Tue, 21 Jul 2020 15:14:20 +0000 (15:14 +0000)]
adjust test framework to not require a tty

4 years agoundocumented options -O outfilename and -O tagfilename
Ingo Schwarze [Tue, 21 Jul 2020 15:10:01 +0000 (15:10 +0000)]
undocumented options -O outfilename and -O tagfilename
to support regression testing without a tty;
no user visible change intended

4 years agoSwitch the default pager from "more -s" to "less".
Ingo Schwarze [Mon, 20 Jul 2020 16:57:29 +0000 (16:57 +0000)]
Switch the default pager from "more -s" to "less".

POSIX explicitly allows using a different default pager if that is
documented.  Nowadays, the pager provided in most operating systems
is less(1).  Our man(1) implementation uses less(1) features that
traditional more(1) did not provide, in particular tagging.  Besides,
as noted by deraadt@, the user interface of less(1) is slightly
more refined and preferable over the user inferface of more(1).
This switch was originally suggested by Ian Ropers.

In ./configure, test whether less(1) is available.  If not, fall
back to more(1).  In ./configure.local, support overriding the
automatic test by setting BINM_PAGER.

As explained by jmc@ and deraadt@, the -s flag was added a very
long time ago when an antique version of groff(1) had an annoying
bug in terminal output that would randomly display blank lines in
the middle of pages.  Clearly, -s has no longer been needed for
many years, so drop it from the default pager invocation.

OK deraadt@ jmc@ martijn@ job@ on the OpenBSD version of this patch.

4 years agoSupport the "powerpc64" architecture name.
Ingo Schwarze [Mon, 29 Jun 2020 19:22:09 +0000 (19:22 +0000)]
Support the "powerpc64" architecture name.
The first file using it in .Dt was just committed by kettenis@.

4 years agoBriefly mention groff_mdoc(7) below SEE ALSO. While both authoritative
Ingo Schwarze [Thu, 25 Jun 2020 20:45:09 +0000 (20:45 +0000)]
Briefly mention groff_mdoc(7) below SEE ALSO.  While both authoritative
manual pages document the same content, comparing can occasionally help
in cases of doubt, and some people may prefer one style, some the other.
While here, modernize a few .Lks from http:// to https://.
OK jmc@

4 years agomore details about ASCII control characters
Ingo Schwarze [Wed, 24 Jun 2020 12:09:29 +0000 (12:09 +0000)]
more details about ASCII control characters

4 years agoProvide a real feature test for __attribute__().
Ingo Schwarze [Mon, 22 Jun 2020 20:00:38 +0000 (20:00 +0000)]
Provide a real feature test for __attribute__().
Looking at version numbers like __GNUC__ is always a bad idea.
Believe it or not, this even makes ./configure shorter by one line.

4 years agoBecause mandoc_aux.h and mandoc.h use __attribute__, all files that
Ingo Schwarze [Mon, 22 Jun 2020 19:20:40 +0000 (19:20 +0000)]
Because mandoc_aux.h and mandoc.h use __attribute__, all files that
include mandoc_aux.h or mandoc.h need to include config.h, too.
It is suspected that for example IRIX needs this, or it is likely
to throw errors in these files because the system compiler doesn't
understand __attribute__.
Issue reported by Kazuo Kuroi <kazuo at irixnet dot org>.

4 years agoJohn Gardner: handling of ASCII control characters during input
Ingo Schwarze [Mon, 22 Jun 2020 18:00:30 +0000 (18:00 +0000)]
John Gardner: handling of ASCII control characters during input

4 years agoManually tag the section option.
Ingo Schwarze [Wed, 17 Jun 2020 19:42:32 +0000 (19:42 +0000)]
Manually tag the section option.
Automatic tagging does not work because the [-s] flag is optional.
Patch from Martin Vahlensieck.

4 years agoSync stringlist implementation with NetBSD.
Ingo Schwarze [Mon, 15 Jun 2020 21:48:09 +0000 (21:48 +0000)]
Sync stringlist implementation with NetBSD.
Various improvements of security, functionality, and style.

4 years agosync with OpenBSD, no functional change intended
Ingo Schwarze [Mon, 15 Jun 2020 20:49:57 +0000 (20:49 +0000)]
sync with OpenBSD, no functional change intended

4 years agoupdate millert@'s email address
Ingo Schwarze [Mon, 15 Jun 2020 20:19:39 +0000 (20:19 +0000)]
update millert@'s email address

4 years agodocument -T html -O tag as implemented in main.c rev. 1.350
Ingo Schwarze [Mon, 15 Jun 2020 18:05:18 +0000 (18:05 +0000)]
document -T html -O tag as implemented in main.c rev. 1.350

4 years agoSupport -T html -O tag by passing a file:// URI to the pager.
Ingo Schwarze [Mon, 15 Jun 2020 17:25:42 +0000 (17:25 +0000)]
Support -T html -O tag by passing a file:// URI to the pager.
Feature suggested by and implementation based on a patch
from Abel Romero Perez <romeroperezabel at gmail dot com>.

4 years agoadd missing compat_stringlist.o to ALL_COBJS, useful for make clean
Ingo Schwarze [Mon, 15 Jun 2020 16:58:24 +0000 (16:58 +0000)]
add missing compat_stringlist.o to ALL_COBJS, useful for make clean

4 years agoOnly compile compat_*.c implementations that are actually needed.
Ingo Schwarze [Mon, 15 Jun 2020 01:37:14 +0000 (01:37 +0000)]
Only compile compat_*.c implementations that are actually needed.
That's cleaner and it is supposed to fix compiler warnings with gcc 10
reported by Wynn Wolf Arbor <wolf at oriole dot systems> on discuss@.

4 years agoMake the ./configure script simpler, more robust, and 23 lines shorter:
Ingo Schwarze [Sun, 14 Jun 2020 23:40:31 +0000 (23:40 +0000)]
Make the ./configure script simpler, more robust, and 23 lines shorter:
* three rather than four arguments for singletest()
* let runtest() support testing two variants of compiler flags
* always report a failed test, even when another test follows
* run all tests before detecting fatal conditions
* rename HAVE_CMSG_XPG42 to NEED_XPG4_2 for consistency
* consistently use braces for shell variable interpolation
* drop archaic "X${" syntax and unusual "==" in string comparisons

4 years agomerge rev. 1.58 from OpenBSD (deraadt@):
Ingo Schwarze [Sun, 14 Jun 2020 23:08:35 +0000 (23:08 +0000)]
merge rev. 1.58 from OpenBSD (deraadt@):
recallocarray() the string buffer, to avoid leaving such contents
around in the address space.  Don't bother doing so for the buffer
which contains aslr'd pointers...
OK millert@

4 years agoGive the fts_compar struct member a real prototype.
Ingo Schwarze [Sun, 14 Jun 2020 22:49:36 +0000 (22:49 +0000)]
Give the fts_compar struct member a real prototype.
This adds clarity and avoids compiler warnings.

4 years agoFix a regression in rev. 1.319 (2019/03/03):
Ingo Schwarze [Sun, 14 Jun 2020 16:24:18 +0000 (16:24 +0000)]
Fix a regression in rev. 1.319 (2019/03/03):
Pass the right object to html_reset() or it will crash
when rendering more than one manual page to HTML in a row.
Bug reported by Abel Romero Perez <romeroperezabel at gmail dot com>.
Patch from otto@.

4 years agoWhile we do not recommend the idiom ".Fl Fl long" for long options
Ingo Schwarze [Sun, 26 Apr 2020 21:41:07 +0000 (21:41 +0000)]
While we do not recommend the idiom ".Fl Fl long" for long options
because it is an abuse of semantic macros for device-specific
presentational effects, this idiom is so widespread that it makes
sense to convert it to the recommended ".Fl \-long" during the
validation phase.  For example, this improves HTML formatting
in pages where authors have used the dubious .Fl Fl.

Feature suggested by Steffen Nurpmeso <steffen at sdaoden dot eu>
on freebsd-hackers.

4 years agoResurrect the documentation of the print_otag() 's' attribute specifier,
Ingo Schwarze [Fri, 24 Apr 2020 13:13:06 +0000 (13:13 +0000)]
Resurrect the documentation of the print_otag() 's' attribute specifier,
reverting a minor part of rev. 1.21.  Contrary to what i thought, that
attribute *is* still supported for a small number of unusual cases.

4 years agoprovide a STYLE message when mandoc knows the file name and the extension
Ingo Schwarze [Fri, 24 Apr 2020 12:02:33 +0000 (12:02 +0000)]
provide a STYLE message when mandoc knows the file name and the extension
disagrees with the section number given in the .Dt or .TH macro;
feature suggested and patch tested by jmc@

4 years agoIn fragment identifiers, use ~%d for ordinal suffixes,
Ingo Schwarze [Mon, 20 Apr 2020 13:07:24 +0000 (13:07 +0000)]
In fragment identifiers, use ~%d for ordinal suffixes,
and reserve the character '~' for that purpose.

Bug found by validator.w3.org in openssl(1), which contains both a
tag "tls1_2" and a second instance of a tag "tls1", which also resulted
in "tls1_2", causing a clash.  Now, the second instance of "tls1" is
rendered as "tls1~2" instead, employing the newly reserved '~'.

4 years agoWhen .Bd, .D1, or .Dl is tagged, attach the permalink
Ingo Schwarze [Sun, 19 Apr 2020 16:36:16 +0000 (16:36 +0000)]
When .Bd, .D1, or .Dl is tagged, attach the permalink
to the first few letters, similar to what was earlier done for .Pp.

4 years agoCorrectly handle non-unique tags even when NODE_ID and NODE_HREF fall
Ingo Schwarze [Sun, 19 Apr 2020 15:16:56 +0000 (15:16 +0000)]
Correctly handle non-unique tags even when NODE_ID and NODE_HREF fall
apart, NODE_ID occurring earlier than NODE_HREF.

4 years agoMajor update:
Ingo Schwarze [Sat, 18 Apr 2020 20:44:09 +0000 (20:44 +0000)]
Major update:
Complete includes, add several functions, no more <?xml?>,
no more style attributes, NODE_HREF flag, mention roff_html.c.

4 years agoWhen a .Tg is attached to a paragraph, attach the permalink
Ingo Schwarze [Sat, 18 Apr 2020 20:40:10 +0000 (20:40 +0000)]
When a .Tg is attached to a paragraph, attach the permalink
to the first word, or the first few words if they are short.

4 years agoUse a separate node->tag attribute rather than abusing the node->string
Ingo Schwarze [Wed, 8 Apr 2020 11:56:03 +0000 (11:56 +0000)]
Use a separate node->tag attribute rather than abusing the node->string
attribute for the purpose.  No functional change intended.
The purpose is to make it possible to later attach tags to text nodes.

4 years agoSeparate the place to put the <a href> permalink (now marked
Ingo Schwarze [Tue, 7 Apr 2020 22:56:02 +0000 (22:56 +0000)]
Separate the place to put the <a href> permalink (now marked
with NODE_HREF) from the target element of the link (still marked
with NODE_ID).  In many cases, use this to move the target to the
beginning of the paragraph, such that readers don't get dropped
into the middle of a sentence.

4 years agoSupport manual tagging of .Pp, .Bd, .D1, .Dl, .Bl, and .It.
Ingo Schwarze [Mon, 6 Apr 2020 10:16:17 +0000 (10:16 +0000)]
Support manual tagging of .Pp, .Bd, .D1, .Dl, .Bl, and .It.
In HTML output, improve the logic for writing inside permalinks:
skip them when there is no child content or when there is a risk
that the children might contain flow content.

4 years agoautomatically tag .SH and .SS in man(7) terminal output
Ingo Schwarze [Sat, 4 Apr 2020 20:33:33 +0000 (20:33 +0000)]
automatically tag .SH and .SS in man(7) terminal output
in the same way as it was done for .Sh and .Ss in mdoc(7)

4 years agoRemove some stray argument names from function prototypes,
Ingo Schwarze [Fri, 3 Apr 2020 11:35:01 +0000 (11:35 +0000)]
Remove some stray argument names from function prototypes,
for consistency with the dominant style used in mandoc.
No functional change.
Patch from Martin Vahlensieck <academicsolutions dot ch>.

4 years ago#include <stdint.h> because that is needed before #include <ohash.h>;
Ingo Schwarze [Fri, 3 Apr 2020 10:30:09 +0000 (10:30 +0000)]
#include <stdint.h> because that is needed before #include <ohash.h>;
fixing a build failure of mandoc-portable on Arch Linux
reported by Stephen Gregoratto <dev at sgregoratto dot me>.

4 years agoWhen the last file formatted yielded no tags, the tags file got
Ingo Schwarze [Thu, 2 Apr 2020 22:12:55 +0000 (22:12 +0000)]
When the last file formatted yielded no tags, the tags file got
deleted before starting the pager, even when earlier input files
had written to it; thanks to weerd@ for reporting that bug.

Since we now generate tags for section headers, we almost always
generate at least some.  Consequently, while fixing the above bug,
simplify the code by never deleting the tags file before the pager
exits, not even in the rare case that the file happens to be empty.
Hence, this patch is -75 +63 LOC even though it fixes two bugs.

While deleting the output files belongs after exit from the pager,
closing them should be done before it is started.  Collect the
related code, which was scattered in various places, to where
it belongs, in a dedicated function in the term_tag.c module.
As a side benefit, never fclose(2) stdout, only dup2(2) to it.

Similarly, when the -O tag argument wasn't found in the last file
formatted, there was a complaint about "no such tag" even when the
argument did occur in earlier files.  Fix that by looking for a
matching tag after every formatted file rather than just once at
the very end.  Given that command line arguments aren't properties
of the file(s) being formatted, that check is a job for the main
program, not for the formatters, so while fixing the check, move
it from term_tag.c to main.c.

4 years agoCopy tagged strings before marking hyphens as breakable.
Ingo Schwarze [Thu, 2 Apr 2020 15:04:36 +0000 (15:04 +0000)]
Copy tagged strings before marking hyphens as breakable.
For example, this makes ":tCo-processes" work in ksh(1).

4 years agoJust like we are already doing it in HTML output, automatically tag
Ingo Schwarze [Wed, 1 Apr 2020 20:21:08 +0000 (20:21 +0000)]
Just like we are already doing it in HTML output, automatically tag
section and subsection headers in terminal output, too.  Even though
admittedly, commands like "/SEE" and "/   Subsec" work, too, there
is no downside, and besides, with the recent improvements in the
tagging framework, implementation cost is negligible.

4 years agoEven though the HTML, man, markdown, PDF, PostScript, and tree formatters
Ingo Schwarze [Sat, 28 Mar 2020 16:18:43 +0000 (16:18 +0000)]
Even though the HTML, man, markdown, PDF, PostScript, and tree formatters
never write a ctags(1) file, using a pager still requires writing the
main output file and passing the file name to the pager.
Recent regression mentioned on IRC and reported by kn@.

4 years agotest skipping of initial hyphens and minus signs in automatic tags;
Ingo Schwarze [Sat, 21 Mar 2020 00:25:19 +0000 (00:25 +0000)]
test skipping of initial hyphens and minus signs in automatic tags;
related to tags.c rev. 1.30

4 years agoWhen setting automatic tags, skip initial hyphens and minus signs,
Ingo Schwarze [Sat, 21 Mar 2020 00:17:31 +0000 (00:17 +0000)]
When setting automatic tags, skip initial hyphens and minus signs,
bringing the behaviour for mdoc(7) closer to what is already done
for man(7).
Triggered by the observation of kn@ that automatic tagging didn't
work very well for find(1) primaries.
OK kn@

4 years agoThe tag file always needs to be closed before starting the pager,
Ingo Schwarze [Thu, 19 Mar 2020 12:21:37 +0000 (12:21 +0000)]
The tag file always needs to be closed before starting the pager,
even when no output formatter was allocated because all pages
shown were preformatted.  Regression in previous reported
by <Andreas dot Kahari at abc dot se> on bugs@.

4 years agoMake the "make depend" maintainer target more convenient
Ingo Schwarze [Fri, 13 Mar 2020 17:31:44 +0000 (17:31 +0000)]
Make the "make depend" maintainer target more convenient
by having it run ./configure with native fts and ohash disabled.

4 years agoProperly reset the validation part of the tagging module between files.
Ingo Schwarze [Fri, 13 Mar 2020 16:16:58 +0000 (16:16 +0000)]
Properly reset the validation part of the tagging module between files.
This fixes a crash in makewhatis(8) encountered by naddy@.

4 years agoSplit tagging into a validation part including prioritization
Ingo Schwarze [Fri, 13 Mar 2020 15:32:28 +0000 (15:32 +0000)]
Split tagging into a validation part including prioritization
in tag.{h,c} and {mdoc,man}_validate.c
and into a formatting part including command line argument checking
in term_tag.{h,c}, html.c, and {mdoc|man}_{term|html}.c.

Immediate functional benefits include:
* Improved prioritization of automatic tags for .Em and .Sy.
* Avoiding bogus automatic tags when .Em, .Fn, or .Sy are explicitly tagged.
* Explicit tagging of .Er and .Fl now works in HTML output.
* Automatic tagging of .IP and .TP now works in HTML output.
But mainly, this patch provides clean earth to build further improvements on.

Technical changes:
* Main program: Write a tag file for ASCII and UTF-8 output only.
* All formatters: There is no more need to delay writing the tags.
* mdoc(7)+man(7) formatters: No more need for elaborate syntax tree inspection.
* HTML formatter: If available, use the "string" attribute as the tag.
* HTML formatter: New function to write permalinks, to reduce code duplication.

Style cleanup in the vicinity while here:
* mdoc(7) terminal formatter: To set up bold font for children,
defer to termp_bold_pre() rather than calling term_fontpush() manually.
* mdoc(7) terminal formatter: Garbage collect some duplicate functions.
* mdoc(7) HTML formatter: Unify <code> handling, delete redundant functions.
* Where possible, use switch statements rather than if cascades.
* Get rid of some more Yoda notation.

The necessity for such changes was first discussed with kn@, but i didn't
bother him with a request to review the resulting -673/+782 line patch.

4 years agoThe HTML standard does not allow self-closing syntax for non-void elements.
Ingo Schwarze [Thu, 27 Feb 2020 22:28:13 +0000 (22:28 +0000)]
The HTML standard does not allow self-closing syntax for non-void elements.
Consequently, write an explicit end tag for <mark> elements.

4 years agoFully support explicit tagging of .Sh and .Ss.
Ingo Schwarze [Thu, 27 Feb 2020 21:43:44 +0000 (21:43 +0000)]
Fully support explicit tagging of .Sh and .Ss.
This fixes the offset of two lines in terminal output
and this improves HTML output by putting the id= attribute
and <a> element into the respective <h1> or <h2> element rather
than writing an additional <mark> element.

To that end, introduce node flags NODE_ID (to make the node a link
target, for example by writing an HTML id= attribute or by calling
tag_put()) and NODE_HREF (to make the node a link source, used only
in HTML output, used only to write an <a class="permalink"> element).

In particular:
* In the validator, generalize the concept of the "next node"
such that it also works before .Sh and .Ss.
* If the first argument of .Tg is empty, don't forget to complain
if there are additional arguments, which will be ignored.
* In the terminal formatter, support writing of explicit tags
for all kinds of nodes, not just for .Tg.
* In deroff(), allow nodes to have an explicit string representation
even when they aren't text nodes.  Use this for explicitly tagged
section headers.  Suprisingly, this is sufficient to make HTML
output work, without explicit code changes in the HTML formatter.
* In syntax tree output, display NODE_ID and NODE_HREF.

4 years agoIntroduce the concept of nodes that are semantically transparent:
Ingo Schwarze [Thu, 27 Feb 2020 01:43:52 +0000 (01:43 +0000)]
Introduce the concept of nodes that are semantically transparent:
they are skipped when looking for previous or following high-level
macros.  Examples include roff(7) .ft, .ll, and .ta, mdoc(7) .Sm
and .Tg, and man(7) .DT and .PD.  Use this concept for a variety
of improved decisions in various validators and formatters.

While here,
* remove a few const qualifiers on struct arguments that caused trouble;
* get rid of some more Yoda notation in the vicinity;
* and apply some other stylistic improvements in the vicinity.

I found this class of issues while considering .Tg patches from kn@.

4 years agoFix this test after the recent Unicode update in OpenBSD base.
Ingo Schwarze [Thu, 27 Feb 2020 00:36:20 +0000 (00:36 +0000)]
Fix this test after the recent Unicode update in OpenBSD base.
The test uses U+07FF NKO TAMAN SIGN because it is the highest
code point having a two-byte UTF-8 representation.
This character is a new single-width punctuation character in
Unicode 11, such that mandoc now does correct horizontal spacing.
We already used the code point for the test before it was assigned,
which resulted in weird spacing because wcwidth(3) returns -1 for
unassigned code points.

4 years agoMarc Espie reported that "man p*ipc" displayed the perlipc(1) manual.
Ingo Schwarze [Mon, 24 Feb 2020 21:16:31 +0000 (21:16 +0000)]
Marc Espie reported that "man p*ipc" displayed the perlipc(1) manual.
The reason was that as a last resort when failing to find a page
name in mandoc.db(5) or at a few well well-defined fully qualified
file names, man(1) uses glob(3) to look for candidate files in
relevant directories, because some operating systems have weird
file name extensions, for example pcap.3pcap and BF_set_key.3ssl
on Linux.  But during that globbing, the metacharacters "*?[" need
to be escaped in the name, section, and path supplied by the user,
or you would get weird false positives and misleading warning
messages and would be unable to use the fallback for path or file
names that actually contain an opening bracket.
Feedback and OK espie@.

4 years agobugfix: indented paragraph macros need a space character
Ingo Schwarze [Thu, 20 Feb 2020 22:55:42 +0000 (22:55 +0000)]
bugfix: indented paragraph macros need a space character
before the width argument

4 years agobugfix: .Tg must be ignored completely in these output modes
Ingo Schwarze [Thu, 20 Feb 2020 00:29:16 +0000 (00:29 +0000)]
bugfix: .Tg must be ignored completely in these output modes

4 years agoMention that .AT, .P, .SB, and .UC are extensions; it really matters
Ingo Schwarze [Tue, 18 Feb 2020 17:31:28 +0000 (17:31 +0000)]
Mention that .AT, .P, .SB, and .UC are extensions; it really matters
because we only retain the language for backward compatibility in
the first place.  Part of the research done by <G dot Branden dot
Robinson at gmail dot com>, see the list <groff at gnu dot org> for
details.

No change to the following conventions: Consider portable whatever
made it into GNU troff no later than 4.4BSD.  For portable extensions,
mention their origin at the end of the description.  For non-portable
extensions, for example from man-ext, usually warn earlier, near
the beginning of the description.

4 years agomention that -T man does not support eqn(7) and tbl(7);
Ingo Schwarze [Sat, 15 Feb 2020 15:28:13 +0000 (15:28 +0000)]
mention that -T man does not support eqn(7) and tbl(7);
triggered by a question from Stephen Gregoratto <dev at sgregoratto dot me>

4 years agotwo new entries: "Fl Fl" to "Fl \-" in validation and eqn/tbl in -T man
Ingo Schwarze [Sat, 15 Feb 2020 14:59:21 +0000 (14:59 +0000)]
two new entries: "Fl Fl" to "Fl \-" in validation and eqn/tbl in -T man

4 years agoMention that the .Dd "date" argument is the date of the last change.
Ingo Schwarze [Thu, 13 Feb 2020 18:32:56 +0000 (18:32 +0000)]
Mention that the .Dd "date" argument is the date of the last change.
Triggered by a question from Jason A. Donenfeld.

While here, delete three COMPATIBILITY entries that i fixed some time ago.

4 years agoDigit-width and narrow spaces are non-breaking.
Ingo Schwarze [Thu, 13 Feb 2020 16:18:29 +0000 (16:18 +0000)]
Digit-width and narrow spaces are non-breaking.
Noticed because Branden Robinson worked on related documentation in groff.

4 years agoIn roff, a space character at the beginning of an input line requires
Ingo Schwarze [Wed, 12 Feb 2020 21:15:53 +0000 (21:15 +0000)]
In roff, a space character at the beginning of an input line requires
starting a new output line, and merely starting a new line of HTML
code isn't sufficient to achieve that.  Solve this in the same way
as mdoc_html.c already does it, by printing a <br/> element.
Fixing a bug reported by Jason A. Donenfeld <Jason at zx2c4 dot com>
in the wg-quick(8) manual page on manpages.debian.org.

4 years agoFinally delete support for the "_whatdb" configuration directive,
Ingo Schwarze [Mon, 10 Feb 2020 14:42:10 +0000 (14:42 +0000)]
Finally delete support for the "_whatdb" configuration directive,
which has a misleading syntax.  It was declared obsolete and
superseded by the "manpath" directive five years ago.

4 years agoReduce the diff to OpenBSD by making FILES a list,
Ingo Schwarze [Mon, 10 Feb 2020 14:13:24 +0000 (14:13 +0000)]
Reduce the diff to OpenBSD by making FILES a list,
even though it has only one entry in the portable version.
Do not add /etc/examples/man.conf for the portable version, though.

4 years agoThe man(1) command was already available in AT&T Version 2 UNIX.
Ingo Schwarze [Mon, 10 Feb 2020 14:04:11 +0000 (14:04 +0000)]
The man(1) command was already available in AT&T Version 2 UNIX.
Jonathan Gray found it in the "Combined Table of Contents" in Doug
McIlroy's "A Research UNIX Reader", which contains a table of which
edition manuals appeared in, and in both the "Table of Contents"
(page vi) and the body (page 89) of the printed UNIX Programmer's
Manual (June 12, 1972) from bitsavers.

4 years agoFor compatibility with the man(1) implementations of the man-1.6
Ingo Schwarze [Mon, 10 Feb 2020 13:49:15 +0000 (13:49 +0000)]
For compatibility with the man(1) implementations of the man-1.6
and man-db packages, print the manpath if the -w option is given
without a following name argument.

This quirk has been in man-1.6 since at least man-1.5e (1998)
and in man-db since 2012.

Using this feature in portable software is a dubious idea because the
internal organization of manual page directories varies in about a
dozen respects among operating systems, so even if you get the answer,
there is no portable way to use it for looking up anything inside.
However, Matej Cepl <mcepl at suse dot cz> made me aware that some
software, for example the manual viewing functionality in the newest
editors/neovim code, unwisely relies on this feature anyway.

No objections were raised when this patch was shown on tech@.

4 years agoMake sure that -l always causes -w to be ignored, as documented
Ingo Schwarze [Thu, 6 Feb 2020 19:41:40 +0000 (19:41 +0000)]
Make sure that -l always causes -w to be ignored, as documented
in the man(1) manual page.  This bugfix is needed to prevent
the command "man -lw" from dereferencing a NULL pointer.