]> git.cameronkatri.com Git - mandoc.git/log
mandoc.git
4 years agoRemove some stray argument names from function prototypes,
Ingo Schwarze [Fri, 3 Apr 2020 11:35:01 +0000 (11:35 +0000)]
Remove some stray argument names from function prototypes,
for consistency with the dominant style used in mandoc.
No functional change.
Patch from Martin Vahlensieck <academicsolutions dot ch>.

4 years ago#include <stdint.h> because that is needed before #include <ohash.h>;
Ingo Schwarze [Fri, 3 Apr 2020 10:30:09 +0000 (10:30 +0000)]
#include <stdint.h> because that is needed before #include <ohash.h>;
fixing a build failure of mandoc-portable on Arch Linux
reported by Stephen Gregoratto <dev at sgregoratto dot me>.

4 years agoWhen the last file formatted yielded no tags, the tags file got
Ingo Schwarze [Thu, 2 Apr 2020 22:12:55 +0000 (22:12 +0000)]
When the last file formatted yielded no tags, the tags file got
deleted before starting the pager, even when earlier input files
had written to it; thanks to weerd@ for reporting that bug.

Since we now generate tags for section headers, we almost always
generate at least some.  Consequently, while fixing the above bug,
simplify the code by never deleting the tags file before the pager
exits, not even in the rare case that the file happens to be empty.
Hence, this patch is -75 +63 LOC even though it fixes two bugs.

While deleting the output files belongs after exit from the pager,
closing them should be done before it is started.  Collect the
related code, which was scattered in various places, to where
it belongs, in a dedicated function in the term_tag.c module.
As a side benefit, never fclose(2) stdout, only dup2(2) to it.

Similarly, when the -O tag argument wasn't found in the last file
formatted, there was a complaint about "no such tag" even when the
argument did occur in earlier files.  Fix that by looking for a
matching tag after every formatted file rather than just once at
the very end.  Given that command line arguments aren't properties
of the file(s) being formatted, that check is a job for the main
program, not for the formatters, so while fixing the check, move
it from term_tag.c to main.c.

4 years agoCopy tagged strings before marking hyphens as breakable.
Ingo Schwarze [Thu, 2 Apr 2020 15:04:36 +0000 (15:04 +0000)]
Copy tagged strings before marking hyphens as breakable.
For example, this makes ":tCo-processes" work in ksh(1).

4 years agoJust like we are already doing it in HTML output, automatically tag
Ingo Schwarze [Wed, 1 Apr 2020 20:21:08 +0000 (20:21 +0000)]
Just like we are already doing it in HTML output, automatically tag
section and subsection headers in terminal output, too.  Even though
admittedly, commands like "/SEE" and "/   Subsec" work, too, there
is no downside, and besides, with the recent improvements in the
tagging framework, implementation cost is negligible.

4 years agoEven though the HTML, man, markdown, PDF, PostScript, and tree formatters
Ingo Schwarze [Sat, 28 Mar 2020 16:18:43 +0000 (16:18 +0000)]
Even though the HTML, man, markdown, PDF, PostScript, and tree formatters
never write a ctags(1) file, using a pager still requires writing the
main output file and passing the file name to the pager.
Recent regression mentioned on IRC and reported by kn@.

4 years agotest skipping of initial hyphens and minus signs in automatic tags;
Ingo Schwarze [Sat, 21 Mar 2020 00:25:19 +0000 (00:25 +0000)]
test skipping of initial hyphens and minus signs in automatic tags;
related to tags.c rev. 1.30

4 years agoWhen setting automatic tags, skip initial hyphens and minus signs,
Ingo Schwarze [Sat, 21 Mar 2020 00:17:31 +0000 (00:17 +0000)]
When setting automatic tags, skip initial hyphens and minus signs,
bringing the behaviour for mdoc(7) closer to what is already done
for man(7).
Triggered by the observation of kn@ that automatic tagging didn't
work very well for find(1) primaries.
OK kn@

4 years agoThe tag file always needs to be closed before starting the pager,
Ingo Schwarze [Thu, 19 Mar 2020 12:21:37 +0000 (12:21 +0000)]
The tag file always needs to be closed before starting the pager,
even when no output formatter was allocated because all pages
shown were preformatted.  Regression in previous reported
by <Andreas dot Kahari at abc dot se> on bugs@.

4 years agoMake the "make depend" maintainer target more convenient
Ingo Schwarze [Fri, 13 Mar 2020 17:31:44 +0000 (17:31 +0000)]
Make the "make depend" maintainer target more convenient
by having it run ./configure with native fts and ohash disabled.

4 years agoProperly reset the validation part of the tagging module between files.
Ingo Schwarze [Fri, 13 Mar 2020 16:16:58 +0000 (16:16 +0000)]
Properly reset the validation part of the tagging module between files.
This fixes a crash in makewhatis(8) encountered by naddy@.

4 years agoSplit tagging into a validation part including prioritization
Ingo Schwarze [Fri, 13 Mar 2020 15:32:28 +0000 (15:32 +0000)]
Split tagging into a validation part including prioritization
in tag.{h,c} and {mdoc,man}_validate.c
and into a formatting part including command line argument checking
in term_tag.{h,c}, html.c, and {mdoc|man}_{term|html}.c.

Immediate functional benefits include:
* Improved prioritization of automatic tags for .Em and .Sy.
* Avoiding bogus automatic tags when .Em, .Fn, or .Sy are explicitly tagged.
* Explicit tagging of .Er and .Fl now works in HTML output.
* Automatic tagging of .IP and .TP now works in HTML output.
But mainly, this patch provides clean earth to build further improvements on.

Technical changes:
* Main program: Write a tag file for ASCII and UTF-8 output only.
* All formatters: There is no more need to delay writing the tags.
* mdoc(7)+man(7) formatters: No more need for elaborate syntax tree inspection.
* HTML formatter: If available, use the "string" attribute as the tag.
* HTML formatter: New function to write permalinks, to reduce code duplication.

Style cleanup in the vicinity while here:
* mdoc(7) terminal formatter: To set up bold font for children,
defer to termp_bold_pre() rather than calling term_fontpush() manually.
* mdoc(7) terminal formatter: Garbage collect some duplicate functions.
* mdoc(7) HTML formatter: Unify <code> handling, delete redundant functions.
* Where possible, use switch statements rather than if cascades.
* Get rid of some more Yoda notation.

The necessity for such changes was first discussed with kn@, but i didn't
bother him with a request to review the resulting -673/+782 line patch.

4 years agoThe HTML standard does not allow self-closing syntax for non-void elements.
Ingo Schwarze [Thu, 27 Feb 2020 22:28:13 +0000 (22:28 +0000)]
The HTML standard does not allow self-closing syntax for non-void elements.
Consequently, write an explicit end tag for <mark> elements.

4 years agoFully support explicit tagging of .Sh and .Ss.
Ingo Schwarze [Thu, 27 Feb 2020 21:43:44 +0000 (21:43 +0000)]
Fully support explicit tagging of .Sh and .Ss.
This fixes the offset of two lines in terminal output
and this improves HTML output by putting the id= attribute
and <a> element into the respective <h1> or <h2> element rather
than writing an additional <mark> element.

To that end, introduce node flags NODE_ID (to make the node a link
target, for example by writing an HTML id= attribute or by calling
tag_put()) and NODE_HREF (to make the node a link source, used only
in HTML output, used only to write an <a class="permalink"> element).

In particular:
* In the validator, generalize the concept of the "next node"
such that it also works before .Sh and .Ss.
* If the first argument of .Tg is empty, don't forget to complain
if there are additional arguments, which will be ignored.
* In the terminal formatter, support writing of explicit tags
for all kinds of nodes, not just for .Tg.
* In deroff(), allow nodes to have an explicit string representation
even when they aren't text nodes.  Use this for explicitly tagged
section headers.  Suprisingly, this is sufficient to make HTML
output work, without explicit code changes in the HTML formatter.
* In syntax tree output, display NODE_ID and NODE_HREF.

4 years agoIntroduce the concept of nodes that are semantically transparent:
Ingo Schwarze [Thu, 27 Feb 2020 01:43:52 +0000 (01:43 +0000)]
Introduce the concept of nodes that are semantically transparent:
they are skipped when looking for previous or following high-level
macros.  Examples include roff(7) .ft, .ll, and .ta, mdoc(7) .Sm
and .Tg, and man(7) .DT and .PD.  Use this concept for a variety
of improved decisions in various validators and formatters.

While here,
* remove a few const qualifiers on struct arguments that caused trouble;
* get rid of some more Yoda notation in the vicinity;
* and apply some other stylistic improvements in the vicinity.

I found this class of issues while considering .Tg patches from kn@.

4 years agoFix this test after the recent Unicode update in OpenBSD base.
Ingo Schwarze [Thu, 27 Feb 2020 00:36:20 +0000 (00:36 +0000)]
Fix this test after the recent Unicode update in OpenBSD base.
The test uses U+07FF NKO TAMAN SIGN because it is the highest
code point having a two-byte UTF-8 representation.
This character is a new single-width punctuation character in
Unicode 11, such that mandoc now does correct horizontal spacing.
We already used the code point for the test before it was assigned,
which resulted in weird spacing because wcwidth(3) returns -1 for
unassigned code points.

4 years agoMarc Espie reported that "man p*ipc" displayed the perlipc(1) manual.
Ingo Schwarze [Mon, 24 Feb 2020 21:16:31 +0000 (21:16 +0000)]
Marc Espie reported that "man p*ipc" displayed the perlipc(1) manual.
The reason was that as a last resort when failing to find a page
name in mandoc.db(5) or at a few well well-defined fully qualified
file names, man(1) uses glob(3) to look for candidate files in
relevant directories, because some operating systems have weird
file name extensions, for example pcap.3pcap and BF_set_key.3ssl
on Linux.  But during that globbing, the metacharacters "*?[" need
to be escaped in the name, section, and path supplied by the user,
or you would get weird false positives and misleading warning
messages and would be unable to use the fallback for path or file
names that actually contain an opening bracket.
Feedback and OK espie@.

4 years agobugfix: indented paragraph macros need a space character
Ingo Schwarze [Thu, 20 Feb 2020 22:55:42 +0000 (22:55 +0000)]
bugfix: indented paragraph macros need a space character
before the width argument

4 years agobugfix: .Tg must be ignored completely in these output modes
Ingo Schwarze [Thu, 20 Feb 2020 00:29:16 +0000 (00:29 +0000)]
bugfix: .Tg must be ignored completely in these output modes

4 years agoMention that .AT, .P, .SB, and .UC are extensions; it really matters
Ingo Schwarze [Tue, 18 Feb 2020 17:31:28 +0000 (17:31 +0000)]
Mention that .AT, .P, .SB, and .UC are extensions; it really matters
because we only retain the language for backward compatibility in
the first place.  Part of the research done by <G dot Branden dot
Robinson at gmail dot com>, see the list <groff at gnu dot org> for
details.

No change to the following conventions: Consider portable whatever
made it into GNU troff no later than 4.4BSD.  For portable extensions,
mention their origin at the end of the description.  For non-portable
extensions, for example from man-ext, usually warn earlier, near
the beginning of the description.

4 years agomention that -T man does not support eqn(7) and tbl(7);
Ingo Schwarze [Sat, 15 Feb 2020 15:28:13 +0000 (15:28 +0000)]
mention that -T man does not support eqn(7) and tbl(7);
triggered by a question from Stephen Gregoratto <dev at sgregoratto dot me>

4 years agotwo new entries: "Fl Fl" to "Fl \-" in validation and eqn/tbl in -T man
Ingo Schwarze [Sat, 15 Feb 2020 14:59:21 +0000 (14:59 +0000)]
two new entries: "Fl Fl" to "Fl \-" in validation and eqn/tbl in -T man

4 years agoMention that the .Dd "date" argument is the date of the last change.
Ingo Schwarze [Thu, 13 Feb 2020 18:32:56 +0000 (18:32 +0000)]
Mention that the .Dd "date" argument is the date of the last change.
Triggered by a question from Jason A. Donenfeld.

While here, delete three COMPATIBILITY entries that i fixed some time ago.

4 years agoDigit-width and narrow spaces are non-breaking.
Ingo Schwarze [Thu, 13 Feb 2020 16:18:29 +0000 (16:18 +0000)]
Digit-width and narrow spaces are non-breaking.
Noticed because Branden Robinson worked on related documentation in groff.

4 years agoIn roff, a space character at the beginning of an input line requires
Ingo Schwarze [Wed, 12 Feb 2020 21:15:53 +0000 (21:15 +0000)]
In roff, a space character at the beginning of an input line requires
starting a new output line, and merely starting a new line of HTML
code isn't sufficient to achieve that.  Solve this in the same way
as mdoc_html.c already does it, by printing a <br/> element.
Fixing a bug reported by Jason A. Donenfeld <Jason at zx2c4 dot com>
in the wg-quick(8) manual page on manpages.debian.org.

4 years agoFinally delete support for the "_whatdb" configuration directive,
Ingo Schwarze [Mon, 10 Feb 2020 14:42:10 +0000 (14:42 +0000)]
Finally delete support for the "_whatdb" configuration directive,
which has a misleading syntax.  It was declared obsolete and
superseded by the "manpath" directive five years ago.

4 years agoReduce the diff to OpenBSD by making FILES a list,
Ingo Schwarze [Mon, 10 Feb 2020 14:13:24 +0000 (14:13 +0000)]
Reduce the diff to OpenBSD by making FILES a list,
even though it has only one entry in the portable version.
Do not add /etc/examples/man.conf for the portable version, though.

4 years agoThe man(1) command was already available in AT&T Version 2 UNIX.
Ingo Schwarze [Mon, 10 Feb 2020 14:04:11 +0000 (14:04 +0000)]
The man(1) command was already available in AT&T Version 2 UNIX.
Jonathan Gray found it in the "Combined Table of Contents" in Doug
McIlroy's "A Research UNIX Reader", which contains a table of which
edition manuals appeared in, and in both the "Table of Contents"
(page vi) and the body (page 89) of the printed UNIX Programmer's
Manual (June 12, 1972) from bitsavers.

4 years agoFor compatibility with the man(1) implementations of the man-1.6
Ingo Schwarze [Mon, 10 Feb 2020 13:49:15 +0000 (13:49 +0000)]
For compatibility with the man(1) implementations of the man-1.6
and man-db packages, print the manpath if the -w option is given
without a following name argument.

This quirk has been in man-1.6 since at least man-1.5e (1998)
and in man-db since 2012.

Using this feature in portable software is a dubious idea because the
internal organization of manual page directories varies in about a
dozen respects among operating systems, so even if you get the answer,
there is no portable way to use it for looking up anything inside.
However, Matej Cepl <mcepl at suse dot cz> made me aware that some
software, for example the manual viewing functionality in the newest
editors/neovim code, unwisely relies on this feature anyway.

No objections were raised when this patch was shown on tech@.

4 years agoMake sure that -l always causes -w to be ignored, as documented
Ingo Schwarze [Thu, 6 Feb 2020 19:41:40 +0000 (19:41 +0000)]
Make sure that -l always causes -w to be ignored, as documented
in the man(1) manual page.  This bugfix is needed to prevent
the command "man -lw" from dereferencing a NULL pointer.

4 years agoNo longer try to ask make(1) what the default compiler is, just use "cc".
Ingo Schwarze [Wed, 5 Feb 2020 15:12:11 +0000 (15:12 +0000)]
No longer try to ask make(1) what the default compiler is, just use "cc".
That line was a bad idea in the first place, it tried to be too clever,
and it failed in different ways on different platforms.  Even when it
succeeded, what make(1) considered the default wasn't always useful.
Having a simple and robust default and asking users to override it
when needed is better.

5 years agoRepair more of the issues that i found in filescan() while investigating
Ingo Schwarze [Sun, 26 Jan 2020 21:25:41 +0000 (21:25 +0000)]
Repair more of the issues that i found in filescan() while investigating
the report from <Andreas dot Kahari at abc dot se> on ports@:

For a symlink, use the first of the following names that is available:
1. In -t mode, the symlink itself (unchanged).
2. When the (unresolved) symlink already resides inside the manpath,
just strip the manpath and use the rest (unchanged).
3. When prefix(es) of the unresolved symlink point to the manpath,
strip the longest such prefix and use the rest (new); this fixes
situations where the manpath or one of its parent directories is a
symlink and at the same time contains symlinks to manual pages.
4. Fall back to the fully resolved symlink, with the manpath stripped
(new); this may for example happen when the command line passes
symlinks from outside the manpath that point to manual pages inside
the manpath, or if manual page trees contain symlinks to symlinks and
not all of them are given on the command line.

The fallback (4) isn't perfect.  You can construct symlink spaghetti
in such a way that this algorithm will not enter all manual page
names into the database that a human would be able to deduce.  But
i do not expect such spaghetti to actually occur in practice (not
even in ports), and a full fix would require re-implementing
realpath(3) in terms of step-by-step readlink(2) calls, repeating
the complicated algorithm (3) after each step.

While here, also stop using PATH_MAX as the size of a static buffer
in filescan(); on some systems, it can be unreasonably large.
Instead, allocate path strings dynamically.

5 years agoFix incorrect file type tests.
Ingo Schwarze [Sun, 26 Jan 2020 11:16:47 +0000 (11:16 +0000)]
Fix incorrect file type tests.
This bug caused sockets and character special devices to be accepted
as manual pages if they appeared inside manpaths, and
it caused incorrect file names to be entered into the database when
the manpath or one of its parent directories was a symbolic link.
This fixes the issues reported by <Andreas dot Kahari at abc dot se>
on ports@, but additional issues remain when symbolic links are
contained in a manpath that involves another symbolic link.

5 years agoMinor cleanup, no functional change:
Ingo Schwarze [Sat, 25 Jan 2020 22:59:22 +0000 (22:59 +0000)]
Minor cleanup, no functional change:
Do not abuse strstr(3) to check whether one long string starts with
another long string.  Instead, use strncmp(3) with the proper length.
In set_basedir(), also reset *basedir in the error brances for extra safety.
While here, invert some more Yoda conditions in the neighbourhood.

5 years agoMake the code more readable by introducing
Ingo Schwarze [Mon, 20 Jan 2020 10:37:15 +0000 (10:37 +0000)]
Make the code more readable by introducing
symbolic constants for tagging priorities.
This review also made me find a minor bug: do not upgrade
TAG_FALLBACK to TAG_WEAK when there is trailing whitespace.

5 years agoIntroduce a new mdoc(7) macro .Tg ("tag") to explicitly mark a place
Ingo Schwarze [Sun, 19 Jan 2020 18:02:00 +0000 (18:02 +0000)]
Introduce a new mdoc(7) macro .Tg ("tag") to explicitly mark a place
as defining a term.  Please only use it when automatic tagging does
not work.  Manual page authors will not be required to add the new
macro; using it remains optional.  HTML output is still rudimentary
in this version and will be polished later.

Thanks to kn@ for reminding me that i have been considering since
BSDCan 2014 whether something like this might be useful.  Given
that possibilities of making automatic tagging better are running
out and there are still several situations where automatic tagging
cannot do the job, i think the time is now ripe.

Feedback and no objection from millert@; OK espie@ inoguchi@ kn@.

5 years agoAlign to the new, sane behaviour of the groff_mdoc(7) .Dd macro:
Ingo Schwarze [Sun, 19 Jan 2020 16:44:50 +0000 (16:44 +0000)]
Align to the new, sane behaviour of the groff_mdoc(7) .Dd macro:
without an argument, use the empty string, and always concatenate
all arguments, no matter their number.
This allows reducing the number of arguments of mandoc_normdate()
and some other simplifications, at the same time polishing some
error messages by adding the name of the macro in question.

5 years agodelete the entry for a crash that was already fixed
Ingo Schwarze [Sun, 19 Jan 2020 16:27:43 +0000 (16:27 +0000)]
delete the entry for a crash that was already fixed

5 years agotest tbl_term.c rev. 1.73 and tbl_data.c rev. 1.53:
Ingo Schwarze [Sat, 11 Jan 2020 21:02:26 +0000 (21:02 +0000)]
test tbl_term.c rev. 1.73 and tbl_data.c rev. 1.53:
incomplete short layout lines followed by longer lines,
and spans at the beginning of layout lines

5 years agoWhen autogenerating one layout cell from a data cell just beyond the
Ingo Schwarze [Sat, 11 Jan 2020 20:48:18 +0000 (20:48 +0000)]
When autogenerating one layout cell from a data cell just beyond the
last layout cell that was explicitly specified, properly initialize
the spacing attribute to indicate that the default is to be used.
Failing to do so and leaving the spacing at zero in this case caused
misformatting when another row further down the table had even more
explicitly specified cells.
Bug found while trying to write regression tests for tbl_term.c rev. 1.73.

5 years agoFix a logic error:
Ingo Schwarze [Sat, 11 Jan 2020 16:26:08 +0000 (16:26 +0000)]
Fix a logic error:
When both the first and the third column are spans, do not use
the number of columns of the span starting in column two
for the span starting in column zero.

With afl, Jan Schreiber <jes at posteo dot de> found cases where
this caused NULL pointer accesses because too many layout cells
were consumed.

While here, make the code more similar at the three places
that iterate over data cells.

5 years agoPrint more tbl(7) details to help debugging:
Ingo Schwarze [Sat, 11 Jan 2020 16:03:42 +0000 (16:03 +0000)]
Print more tbl(7) details to help debugging:
column numbers, options, layout rows, cell types, cell modifiers.

5 years agoautocapitalize=none; also from Tim Baumgard
Ingo Schwarze [Fri, 10 Jan 2020 15:21:19 +0000 (15:21 +0000)]
autocapitalize=none; also from Tim Baumgard

5 years agoSwitch off the useless and annoying "autocomplete" feature;
Ingo Schwarze [Fri, 10 Jan 2020 12:54:43 +0000 (12:54 +0000)]
Switch off the useless and annoying "autocomplete" feature;
issue reported by Tim Baumgard <at bmgrd dot com>.
landry@ and florian@ agree with the general direction.

5 years agoDocument the "delim" syntax and its usage.
Ingo Schwarze [Fri, 10 Jan 2020 11:55:04 +0000 (11:55 +0000)]
Document the "delim" syntax and its usage.
Closing a gap reported by bentley@, who also sent a patch,
but i'm explaining it somewhat differently.
While here, remove duplicate information from the text.
OK bentley@

5 years agoSkip whitespace before tokens, too.
Ingo Schwarze [Wed, 8 Jan 2020 12:16:24 +0000 (12:16 +0000)]
Skip whitespace before tokens, too.
Bug found by bentley@ with input like "delim $$ delim off".

5 years agoImprove the test case by changing the eqn(7) delimiters such that it
Ingo Schwarze [Wed, 8 Jan 2020 11:01:37 +0000 (11:01 +0000)]
Improve the test case by changing the eqn(7) delimiters such that it
actually tests which parts of text lines are processed with eqn(7)
and which are not.

5 years agoEnable generation of the desired delim/basic output with groff(1).
Ingo Schwarze [Wed, 8 Jan 2020 10:54:03 +0000 (10:54 +0000)]
Enable generation of the desired delim/basic output with groff(1).
No functional change for the portable test suite.

5 years agoSimplify maintainer targets in OpenBSD: EQN and TBL variables
Ingo Schwarze [Wed, 8 Jan 2020 10:37:53 +0000 (10:37 +0000)]
Simplify maintainer targets in OpenBSD: EQN and TBL variables
no longer exist and NROFF/NOPTS were replaced with GROFF/GOPTS.
This doesn't change how things work in the protable version
of the test suite.

5 years agoImprove the description of -m/-M/MANPATH/man.conf in multiple respects
Ingo Schwarze [Tue, 7 Jan 2020 11:16:33 +0000 (11:16 +0000)]
Improve the description of -m/-M/MANPATH/man.conf in multiple respects
after kn@ reported that the descriptions were incomplete and somewhat
inaccurate.
OK jmc@ kn@

5 years agoWhen all cells in a tbl(1) column are empty, set the column width
Ingo Schwarze [Tue, 31 Dec 2019 22:58:41 +0000 (22:58 +0000)]
When all cells in a tbl(1) column are empty, set the column width
to 1n rather than to 0n, in the same way as groff does.
This fixes misformatting reported by bentley@ in xkeyboard-config(7).

5 years agoDo not fail an assertion when a high level macro occurs in the body
Ingo Schwarze [Thu, 26 Dec 2019 19:51:51 +0000 (19:51 +0000)]
Do not fail an assertion when a high level macro occurs in the body
of a conditional inside a .ce request block.  Instead, abort the .ce
block just like when there is no conditional in between.

Bug found by espie@ working on the textproc/fstrcmp port.

5 years agodistinction between .Vt and .Va
Ingo Schwarze [Wed, 25 Dec 2019 13:20:33 +0000 (13:20 +0000)]
distinction between .Vt and .Va

5 years agotwo new entries: make .Sh/.Ss parsed in mdoc(7)
Ingo Schwarze [Sun, 22 Dec 2019 13:52:35 +0000 (13:52 +0000)]
two new entries: make .Sh/.Ss parsed in mdoc(7)
and delete release number verification from groff_mdoc(7)

5 years agoIn HTML, display straight quotes, not curly quotes, for Qq/Qo/Qc macros.
Ingo Schwarze [Wed, 11 Dec 2019 18:44:05 +0000 (18:44 +0000)]
In HTML, display straight quotes, not curly quotes, for Qq/Qo/Qc macros.
This is the intended behavior and already the case in terminal output.
Incorrect output noticed by Eldred Habert.
Patch from bentley@.

5 years agoAdd a Content-Security-Policy HTTP header that allows only CSS.
Ingo Schwarze [Sun, 10 Nov 2019 22:35:25 +0000 (22:35 +0000)]
Add a Content-Security-Policy HTTP header that allows only CSS.
This ensures that in a modern browser that understands the header,
mandoc rendering bugs cannot possibly be interpreted as JavaScript.
Patch from bentley@.

5 years agowant to get rid of the last style= attributes, suggested by bentley@
Ingo Schwarze [Sun, 10 Nov 2019 17:38:26 +0000 (17:38 +0000)]
want to get rid of the last style= attributes, suggested by bentley@

5 years ago.ce .if .B crash reported by espie@, and one other bug
Ingo Schwarze [Sat, 9 Nov 2019 17:09:15 +0000 (17:09 +0000)]
.ce .if .B crash reported by espie@, and one other bug

5 years agoIn the past, generating comment nodes stopped at the .TH or .Dd
Ingo Schwarze [Sat, 9 Nov 2019 14:39:49 +0000 (14:39 +0000)]
In the past, generating comment nodes stopped at the .TH or .Dd
macro, which is usually close to the beginning of the file, right
after the Copyright header comments.  But espie@ found horrible
input files in the textproc/fstrcmp port that generate lots of parse
nodes before even getting to the header macro.  In some formatters,
comment nodes after some kinds of real content triggered assertions.

So make sure generation of comment nodes stops once real content is
encountered.

5 years agodraft 1.14.6 release notes
Ingo Schwarze [Sun, 13 Oct 2019 14:45:17 +0000 (14:45 +0000)]
draft 1.14.6 release notes

5 years agoFor invalid queries and for valid queries returning no result,
Ingo Schwarze [Tue, 1 Oct 2019 17:54:14 +0000 (17:54 +0000)]
For invalid queries and for valid queries returning no result,
return the appropriate 40x status code rather than 200.
Improvement suggested and diff tested
by John Gardner <gardnerjohng at gmail dot com>.

5 years agoFix line breaking in no-fill mode (.Bd -unfilled/<pre>),
Ingo Schwarze [Sun, 15 Sep 2019 00:08:55 +0000 (00:08 +0000)]
Fix line breaking in no-fill mode (.Bd -unfilled/<pre>),
which apparently didn't work since the .Pp/<p> reorg.
The new logic is more similar to what the terminal formatter does:

1. Before a node that starts a new mdoc(7) input line,
start a new HTML output line.
2. An empty input line or a .Pp causes an empty output line.
3. Nothing needs to be done at the end of a node.

Severe misformatting was reported in table(5) by
Edgar Pettijohn <edgar at pettijohn dash web dot com> on misc@.

5 years agoImprove validation of function names:
Ingo Schwarze [Fri, 13 Sep 2019 19:26:46 +0000 (19:26 +0000)]
Improve validation of function names:
1. Relax checking to accept function types of the form
"ret_type (fname)(args)" (suggested by Yuri Pankov <yuripv dot net>).
2. Tighten checking to require the closing parenthesis.

5 years agoadapt to print_indent() HTML_NOSPACE fix, html.c rev. 1.261
Ingo Schwarze [Thu, 5 Sep 2019 13:40:34 +0000 (13:40 +0000)]
adapt to print_indent() HTML_NOSPACE fix, html.c rev. 1.261

5 years agoDo not clear HTML_NOSPACE in print_indent().
Ingo Schwarze [Thu, 5 Sep 2019 13:35:04 +0000 (13:35 +0000)]
Do not clear HTML_NOSPACE in print_indent().
I don't think there ever was a reason for doing so.

Besides, there is a discrepacy with respect to the point in the
document affected.  That flag controls whitespace at the current
formatting point.  But when HTML_BUFFER is in effect, the line break
and indentation is typically inserted one word further to the left.
Anything happening at that point to the left can't reasonably
influence spacing at the different point further to the right.

Among other effects, this change avoids some spurious line breaks
in HTML code at points where they weren't supposed to happen, line
breaks that in some cases caused undesirable, visible whitespace
when the resulting HTML was rendered.

5 years agoadapt to new <p> output logic (html.c rev. 1.260)
Ingo Schwarze [Tue, 3 Sep 2019 18:19:37 +0000 (18:19 +0000)]
adapt to new <p> output logic (html.c rev. 1.260)

5 years agoWrap text and phrasing elements in paragraphs unless already
Ingo Schwarze [Tue, 3 Sep 2019 18:08:02 +0000 (18:08 +0000)]
Wrap text and phrasing elements in paragraphs unless already
contained in flow containers; never put them directly into sections.
This helps to format paragraphs with the CSS class selector .Pp.

Suggested by bentley@ and also by Colin Watson <cjwatson at debian>
via Michael Stapelberg <stapelberg at debian>,
see https://github.com/Debian/debiman/issues/116

5 years agoFormat .Nd with more logically with <span> rather than <div>; after all,
Ingo Schwarze [Tue, 3 Sep 2019 15:09:44 +0000 (15:09 +0000)]
Format .Nd with more logically with <span> rather than <div>; after all,
it is supposed to be a one-line description.  For the case where .Nd
generates flow content (which is very bad style but syntactically
valid), rely on the new feature of html_close_paragraph() to close
out the <span> prematurely, effectively moving the flow content out
of the .Nd for HTML presentation.  For the final closing, also rely
on the new html_close_paragraph() functionality, this time triggered
by the subsequent block, which will typically be .Sh SYNOPSIS.

5 years agoMake html_close_paragraph() more versatile, more robust, less
Ingo Schwarze [Tue, 3 Sep 2019 12:31:05 +0000 (12:31 +0000)]
Make html_close_paragraph() more versatile, more robust, less
dependent on individual HTML elements, and simpler: don't just close
<p>, <pre>, and <a>, but any element that establishes phrasing
context.  This doesn't change output for any OpenBSD manual page,
but it will allow using this function more safely and at more places
in the future.

5 years agodelete the TAG_IDIV crutch, which is no longer used
Ingo Schwarze [Sun, 1 Sep 2019 15:12:19 +0000 (15:12 +0000)]
delete the TAG_IDIV crutch, which is no longer used

5 years agoIn the HTML formatter, assert(3) that no HTML nesting violation occurs.
Ingo Schwarze [Thu, 29 Aug 2019 17:57:29 +0000 (17:57 +0000)]
In the HTML formatter, assert(3) that no HTML nesting violation occurs.
Tested on the complete manual page trees of Version 7 AT&T UNIX,
4.4BSD-Lite2, POSIX-2013, OpenBSD 2.2 to 6.5 and -current,
FreeBSD 10.0 to 12.0, NetBSD 6.1.5 to 8.1, DragonFly 3.8.2 to 5.6.1,
and Linux 4.05 to 5.02.

5 years agominor sync of the inline stylesheet with mandoc.css:
Ingo Schwarze [Fri, 2 Aug 2019 17:06:04 +0000 (17:06 +0000)]
minor sync of the inline stylesheet with mandoc.css:
delete unimportant .Pp rule and shorten overly specific selectors

5 years agoSimplification, no functional change:
Ingo Schwarze [Sun, 28 Jul 2019 19:41:21 +0000 (19:41 +0000)]
Simplification, no functional change:
Delete the "argc" argument from fs_search() which is now always 1,
and move error reporting to the main() program where it is more
logically placed and easier to see.

5 years agoThere is no point in pledge(2)ing literally the same list twice,
Ingo Schwarze [Sun, 28 Jul 2019 18:36:06 +0000 (18:36 +0000)]
There is no point in pledge(2)ing literally the same list twice,
so delete the second copy.  No functional change.

5 years agoIn man(1) mode, do the search for each name independently, and
Ingo Schwarze [Sun, 28 Jul 2019 18:23:17 +0000 (18:23 +0000)]
In man(1) mode, do the search for each name independently, and
show the results in the order of the command line arguments.
Implemented by separating the code for man(1) and apropos(1)
in the main() program.
Surprisingly, the number of lines of code remains unchanged.
Issue reported by deraadt@, additional input from millert@.

5 years agoImprove structure, no functional change:
Ingo Schwarze [Sun, 28 Jul 2019 13:13:03 +0000 (13:13 +0000)]
Improve structure, no functional change:
Unify code to process one single input file
and move it into a dedicated new function.

5 years agoMove two more output state variables into the new struct outstate.
Ingo Schwarze [Sat, 27 Jul 2019 13:40:57 +0000 (13:40 +0000)]
Move two more output state variables into the new struct outstate.
Also, move setting of tag_files.tagname into tag_init().
No functional change.

5 years agoCleanup, no functional change:
Ingo Schwarze [Fri, 26 Jul 2019 23:12:15 +0000 (23:12 +0000)]
Cleanup, no functional change:
For clarity, stop storing the same information (in this case, -O
settings) in two structs.  Give the local struct in main.c a more
descriptive name (output state).

5 years agoStructural cleanup, no functional change:
Ingo Schwarze [Fri, 26 Jul 2019 21:03:19 +0000 (21:03 +0000)]
Structural cleanup, no functional change:
Mixing parser and formatter state in the same struct was a bad idea,
so pull the parser state and configuration out of it.
This makes sure output options are not passed into parser functions
and parser options are not passed into output functions.
While here, add comments to the important local variables in main().

5 years agoStructural cleanup, no functional change:
Ingo Schwarze [Fri, 26 Jul 2019 18:01:43 +0000 (18:01 +0000)]
Structural cleanup, no functional change:
Move process group management out of main() into its own function
because it has its own, self-contained logic and its own local variables.

5 years agotagging support for .TP and .TQ; try e.g. man -O tag=commit cvs
Ingo Schwarze [Tue, 23 Jul 2019 17:53:35 +0000 (17:53 +0000)]
tagging support for .TP and .TQ; try e.g. man -O tag=commit cvs

5 years agoSlowly start implementing tagging support for man(7) pages, even
Ingo Schwarze [Mon, 22 Jul 2019 03:21:49 +0000 (03:21 +0000)]
Slowly start implementing tagging support for man(7) pages, even
though it is obvious that this can never become as good as for
mdoc(7) pages.  As a first step, tag alphabetic arguments of .IP
macros, which are often used for lists of options and keywords.

Try "man -O tag=g as" to get the point.

Thanks to Leah Neukirchen for recently reminding me that exploring
how much can be done in this respect may be worthwhile: it is likely
to slightly improve usability while adding only small amounts of
relatively straightforward code.

5 years agoIf no tags were generated at all, unlink(2) the empty tags file as
Ingo Schwarze [Fri, 19 Jul 2019 20:27:25 +0000 (20:27 +0000)]
If no tags were generated at all, unlink(2) the empty tags file as
soon as the condition can be detected and do not pass it to less(1).
This may happen for man(7) pages, for preformatted pages, and for
very simple pages like true(1).  The main benefit is that :t inside
less(1) yields the clearer diagnostic message "No tags file" rather
than the mildly confusing "No such tag in tags file": the latter
might encourage further, futile attempts to jump to other tags.

Improvement suggested by Leah Neukirchen <leah at vuxu dot org>
from The Void.

5 years agonew test for an empty text block; from rea@ via bapt@ (FreeBSD)
Ingo Schwarze [Thu, 18 Jul 2019 14:43:14 +0000 (14:43 +0000)]
new test for an empty text block; from rea@ via bapt@ (FreeBSD)

5 years agodon't print the final heads-up about messages
Ingo Schwarze [Mon, 15 Jul 2019 21:41:08 +0000 (21:41 +0000)]
don't print the final heads-up about messages
when a search did not yield any manual pages to display;
issue found with regress/usr.bin/mandoc/db/

5 years agoexplain escaping of end-of-sentence characters;
Ingo Schwarze [Mon, 15 Jul 2019 19:20:30 +0000 (19:20 +0000)]
explain escaping of end-of-sentence characters;
missing info reported by Ian <ropers at gmail dot com> on misc@

5 years agoIf messages are shown and output is printed without a pager, display
Ingo Schwarze [Sun, 14 Jul 2019 18:16:13 +0000 (18:16 +0000)]
If messages are shown and output is printed without a pager, display
a heads-up on stderr at the end because otherwise, users may easily
miss the messages: because messages typically occur while parsing,
they typically preceed the output.  This is most useful with flag
combinations like "-c -W all" but may also help in some unusual
error scenarios.
Inconvenient ordering of output originally pointed out by espie@
for the example situation that /tmp/ is not writeable.

5 years agoWhen parsing a tab character that is not preceded by a space character
Ingo Schwarze [Thu, 11 Jul 2019 17:06:17 +0000 (17:06 +0000)]
When parsing a tab character that is not preceded by a space character
on an .It -column line, args() sets the MDOC_PHRASEQL flag to Quote
the Last word of the Phrase.  Even if it turns out this quoting is not
needed because the word is already quoted for other reasons, clear the
flag at the end of parsing the phrase, such that the flag does not leak
to the next phrase.

This patch fixes the bug that the trailing Macro on a line of the form
.It "word<tab>word" Ta word Macro<eol>
was incorrectly considered quoted and hence not parsed.

Bug found by Havard Eidnes (he@) with the NetBSD gettytab(5) manual page:
https://gnats.netbsd.org/cgi-bin/query-pr-single.pl?number=54361
Reported via Thomas Klausner (wiz@).

5 years agoSome time ago, i simplified mandoc_msg() such that it can be used
Ingo Schwarze [Wed, 10 Jul 2019 19:39:01 +0000 (19:39 +0000)]
Some time ago, i simplified mandoc_msg() such that it can be used
everywhere and not only in the parsers.
For more uniform messages, use it at more places instead of err(3),
in particular in the main program.
While here, integrate a few trivial functions called at exactly one
place into the main option parser, and let a few more functions use
the normal convention of returning 0 for success and -1 for error.

5 years agoin man.cgi(8), disable -O toc by default; requested by deraadt@
Ingo Schwarze [Wed, 10 Jul 2019 12:49:20 +0000 (12:49 +0000)]
in man.cgi(8), disable -O toc by default; requested by deraadt@

5 years agoThe non-standard .EX/.EE macro pair was invented for Version 9 AT&T UNIX
Ingo Schwarze [Tue, 9 Jul 2019 03:46:59 +0000 (03:46 +0000)]
The non-standard .EX/.EE macro pair was invented for Version 9 AT&T UNIX
and only got adopted by GNU two decades later.
Thanks to Doug McIlroy <doug at cs dot dartmouth dot edu>
for pointing out the error.

5 years agoprevent mandoc from segfaulting if /tmp is not writable;
Ingo Schwarze [Sat, 6 Jul 2019 20:05:27 +0000 (20:05 +0000)]
prevent mandoc from segfaulting if /tmp is not writable;
patch from espie@

5 years agouse the standard spelling of the word "idiosyncrasy";
Ingo Schwarze [Mon, 1 Jul 2019 23:30:16 +0000 (23:30 +0000)]
use the standard spelling of the word "idiosyncrasy";
suggested by Michal Nowak <mnowak at startmail dot com>

5 years agodelete trailing whitespace and space-tab sequences; no code change;
Ingo Schwarze [Mon, 1 Jul 2019 22:56:24 +0000 (22:56 +0000)]
delete trailing whitespace and space-tab sequences; no code change;
patch from Michal Nowak <mnowak at startmail dot com>
who found these with git pbchk in the illumos tree

5 years agoFix mandoc_normdate() and the way it is used.
Ingo Schwarze [Thu, 27 Jun 2019 15:07:30 +0000 (15:07 +0000)]
Fix mandoc_normdate() and the way it is used.
In the past, it could return NULL but the calling code wasn't prepared
to handle that.  Make sure it always returns an allocated string.
While here, simplify the code by handling the "quick" attribute
inside mandoc_normdate() rather than at multiple callsites.

Triggered by deraadt@ pointing out
that snprintf(3) error handling was incomplete in time2a().

5 years agoImprove "man -h" output.
Ingo Schwarze [Thu, 27 Jun 2019 12:20:18 +0000 (12:20 +0000)]
Improve "man -h" output.
1. For pages lacking a SYNOPSIS, show the NAME section rather than nothing.
2. Do not print a stray blank before the beginning of a SYNOPSIS.
Both issues reported by, and patch OK'ed by, tb@.

5 years agoDo not access a NULL pointer if a table contains a horizontal line
Ingo Schwarze [Tue, 11 Jun 2019 16:04:36 +0000 (16:04 +0000)]
Do not access a NULL pointer if a table contains a horizontal line
next to a table line having fewer columns than the table as a whole.
Bug found by Stephen Gregoratto <dev at sgregoratto dot me>
with aerc-config(5).

5 years agoExplicitly state that the cases in the inner switch in term_fill()
Ingo Schwarze [Mon, 3 Jun 2019 20:23:41 +0000 (20:23 +0000)]
Explicitly state that the cases in the inner switch in term_fill()
are exhaustive.  While there is no bug, being explicit has no downside
is is potentially safer for the future.

Michal Nowak <mnowak at startmail dot com> reported that gcc 4.4.4
and 7.4.0 on illumos throw -Wuninitialized false positives.

5 years agoInitialize the local variable "lastln" in mparse_buf_r().
Ingo Schwarze [Mon, 3 Jun 2019 19:58:02 +0000 (19:58 +0000)]
Initialize the local variable "lastln" in mparse_buf_r().
While there is no bug, it logically makes sense given the meaning
of the variable that lastln is NULL as long as firstln is NULL.

Michal Nowak <mnowak at startmail dot com> reported that gcc 4.4.4
and 7.4.0 on illumos throw -Wuninitialized false positives.

5 years agoInitialize the local variable "act" in print_mdoc_node().
Ingo Schwarze [Mon, 3 Jun 2019 19:50:33 +0000 (19:50 +0000)]
Initialize the local variable "act" in print_mdoc_node().
While there is no bug, it helps clarity, and it is also safer in this
particular code because in case a bug gets introduced later, accessing
a NULL pointer is less dangerous than accessing an uninitialized pointer.

Michal Nowak <mnowak at startmail dot com> reported that gcc 4.4.4
and 7.4.0 on illumos throw -Wuninitialized false positives.